[Další] [Předchozí] [Předchozí – na konec] [Na konec] [Výše]
V úvodu Kapitoly 6 jsme zdůraznili, že vyšetřování extrémů funkcí je jednou z nejdůležitějších částí diferenciálního počtu. V předchozích dvou kapitolách jsme si připravili aparát k tomu, abychom mohli vyšetřovat tzv. vázané extrémy. Je to vlastně v jistém smyslu speciální případ lokálních extrémů, avšak metody uvedené v Kapitole 6 zde nejsou vhodné. V prvním odstavci vysvětlíme tzv. metodu Lagrangeových multiplikátorů, kde extrémy původní funkce vyšetřujeme pomocí přiřazené, tzv. Lagrangeovy funkce. Ve druhém odstavci studujeme vázané extrémy pomocí nerovností mezi průměry čísel.
Začněme následující úlohou.
Určete absolutní minimum a maximum funkce u = f(x,y,z) na množině M : x2 + y2 + z2 ≤ 1, x,y,z ≥ 0 (konkrétní tvar funkce f není v tuto chvíli podstatný).
Vyšetřujeme-li
při řešení úlohy funkci
f na
části hranice
tvořené kulovou plochou, vyjádříme z = a
funkci f(x,y,
) vyšetřujeme na množině M :
x2 + y2
≤ 1, x,y ≥
0, tj. najdeme
stacionární body uvnitř
M
a vyšetříme funkci na hranici množiny M. Provést toto na
části hranice
tvořené čtvrtkružnicí znamená
vyjádřit y =
a dosadit
do f,
tj. vyšetřovat funkci f(x,
,0) pro x
[0,1].
Tímto postupem převedeme původní problém vyšetření funkce na hranici na studium extrémů funkce jedné proměnné. Je zřejmé, že tato metoda je nepraktická zejména při větším počtu proměnných. V tomto odstavci si popíšeme tzv. metodu Lagrangeových multiplikátorů, která řešení úlohy podstatně usnadní.
V této kapitole se zabýváme případem, kdy množina M je zadána systémem rovností
g1(x1,…,xn) | = 0 | ||
g2(x1,…,xn) | = 0 | ||
⋮ | (9.1) | ||
gm(x1,…,xn) | = 0, |
Nejprve zformulujme nutnou podmínku pro existenci vázaného extrému.
Věta 9.1. Nechť funkce n
proměnných f,g1,…,gm, 1 ≤ m <
n, mají spojité
parciální derivace 1.
řádu v otevřené množině U
n a
nechť v každém
bodě množiny U má matice
![]() |
(9.2) |
hodnost m. Buď
M množina všech
bodů [x1,…,xn], které
vyhovují rovnicím (9.1
). Má-li funkce
f v bodě
a =
[a1,…,an] M lokální extrém vzhledem
k M,
existují reálná čísla
1,…,
m tak,
že jsou
splněny rovnosti
![]() |
(9.3) |
Poznámka 9.1. i)
Dříve
než přistoupíme k důkazu
tvrzení, objasněme si
význam rovnosti (9.3
). Zprvu
uvažujme nejjednodušší případ n = 2,m = 1. Pak
M je
křivka v 2 zadaná
rovnicí g(x,y) = 0 (píšeme x,y, [x∗,y∗] a g místo x1,x2, a a g1).
Rovnost (9.3) můžeme psát ve tvaru rovnosti dvou dvojrozměrných
vektorů
ii) V obecném případě nechť
f,g
k jsou vektory
parciálních derivací
funkcí f,gk,
k =
1,…,m a nechť
M je
množina určená systémem (9.1
). Pak
v souladu s terminologií z kapitoly o implicitních funkcích
vztah (9.3) říká, že f
(a)
M(a), kde
M(a) je normálový prostor
k M v bodě a.
iii) Funkce
Důkaz Věty 9.1. Předpokládejme nejprve, že funkce gk jsou afinní, tj.
Vzhledem
k tomu, že funkce
gk jsou
afinní a h Lin{g
1(a),…,g
m(a)}
= Lin{u1,…,um}
, je
Nyní vyšetřeme
obecný případ, kdy
funkce gk
nejsou afinní. Pak bod y
sestrojený v předchozí
části
důkazu již
nemusí být prvkem množiny M, proto místo tohoto bodu
musíme uvažovat
jiný bod. Geometricky je jeho nalezení naznačeno na
obrázku 9.1
.
Označme v1,…,vn−m bázi prostoru Lin{g1(a),…,g
m(a)}
a
uvažujme systém rovnic
![]() |
(9.4) |
kde r
n. Pak jsou vzhledem
k nezávislosti
vektorů g
k(a) a výběru vektorů
vk splněny předpoklady Věty 8.3 a systém
rovnic (9.4) určuje
implicitně v okolí
bodu [
,r] =
[0,0]
n
funkci r = r(
) :
n. Podle
Věty 8.3 pro její
derivaci podle
dostáváme r
(
)
=0 = 0, což podle l’Hospitalova
pravidla znamená, že
![]() |
(9.5) |
Nyní položme y = a + h +
r(
).
Podobně jako v první
části
důkazu platí
f(y) | = f(a) + ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
||
= f(a) + ![]() ![]() |
Věta 9.1 říká, že v případě diferencovatelných
funkcí f
a gk
lokální extrém vzhledem k množině M může nastat pouze ve
stacionárním bodě. O tom, zda ve stacionárním
bodě nastává, nebo nenastává lokální extrém, rozhodneme pomocí vlastností
matice druhých
derivací Lagrangeovy funkce L(x,
).
Věta 9.2. Nechť
funkce f a gk,
k =
1,…,m mají spojité
parciální derivace
druhého řádu v bodě
a,
který je stacionárním
bodem f na M, a 1,…,
m jsou
příslušné Lagrangeovy
multiplikátory, tj. L
(a,
) =
0. Dále nechť
matice (9.2
)
má
pro x
= a
hodnost m. Jestliže pro
každé 0≠h
Lin{g
1(a),…,g
m(a)}
platí
![]() |
(9.6) |
má funkce
f v bodě
a ostré
lokální minimum (maximum)
vzhledem k M. Jestliže
existují h, Lin{g
1(a),…,g
m(a)}
taková, že
![]() |
(9.7) |
v bodě a lokální extrém vzhledem k M nenastává.
Důkaz.
Především si všimněme, že pro
x M je f(x) = L(x), tj. x∗
M je lokálním extrémem f
vzhledem k M, právě když je lokálním
extrémem Lagrangeovy
funkce L.
Podobně jako v důkazu
Věty 9.1
můžeme body
y
M vyjádřit ve tvaru
y =
a +
h + r(
), kde h
Lin{g
1(a),…,g
m(a)}
a r :
n
splňuje (9.5
).
Pomocí Taylorova vzorce dostáváme
f(y) = | L(y) = L(a) + ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
||
(![]() ![]() ![]() |
f(a) + ![]() ![]() |
(9.8) |
Předpokládejme,
že
platí (9.6), pak vzhledem ke spojitosti druhých
derivací funkce L
stejné nerovnosti
platí i pro ã
místo a, je-li
dostatečně malé. Limitním přechodem pro
0
v (9.8) dostáváme pro
dostatečně malé
Nyní předpokládejme,
že
existují h, Lin{g
1(a),…,g
m(a)}
taková, že platí (9.7). Položme y1
= a
+
h + r(
), y2
= a
+
+ r(
). Stejným způsobem
jako v předchozí
části
důkazu lze ukázat,
že
pro
dostatečně malá platí
f(y1) > f(a) a f(y2) < f(a), tj. v bodě
a lokální extrém f vzhledem k M
nenastává. □
Nyní si tvrzení posledních dvou vět shrňme do praktického návodu hledání vázaných extrémů funkcí se spojitými druhými derivacemi.
1.
Vytvoříme Lagrangeovu
funkci L(x,) =
f(x) −∑ k=1m
kgk(x).
2. Určíme stacionární body
f vzhledem
k M, tj.
určíme x1,…,xn a
1,…,
m jako
řešení systému n + m rovnic
3. Ze systému m lineárních rovnic
![]() ![]() |
, | ||
⋮ | |||
![]() ![]() |
4. Určíme druhý diferenciál Lagrangeovy funkce vzhledem k proměnným x ve stacionárním bodě a
5. Vyšetříme definitnost vzniklé kvadratické
formy n−m proměnných (je
to vlastně restrikce
kvadratické formy d2L(a,)
na tečný prostor
M(a)). Je-li tato forma
pozitivně (negativně)
definitní, nastává v bodě
a ostré
lokální minimum (maximum), a
je-li indefinitní, v bodě
a vázaný extrém nenastává.
Příklad 9.1. i)
Najděte
lokální extrémy funkce u
= +
+
, a
> b > c, na
množině M : x2
+ y2
+ z2
= 1.
Řešení. Nejprve sestavíme Lagrangeovu funkci úlohy a určíme stacionární body.
Lx = | ![]() ![]() ![]() |
||
Ly = | ![]() ![]() ![]() |
||
Lz = | ![]() ![]() ![]() |
||
x2 + y2 + z2 = 1. |
P1,2 : | d2L = 2(![]() ![]() ![]() ![]() |
||
P3,4 : | d2L = 2(![]() ![]() ![]() ![]() |
||
P5,6 : | d2L = 2(![]() ![]() ![]() ![]() |
ii)
Odvoďte vzorec pro vzdálenost bodu
x∗ = [x1∗,…,xn∗] od roviny a1x1
+ ⋯
+ anxn
= b
v prostoru n.
Řešení. Označme a = [a1,…,an], x = [x1,…,xn]. Pak můžeme úlohu zapsat ve vektorovém tvaru
iii)
Určete obsah elipsy, která vznikne
při řezu elipsoidu +
+
= 1 rovinou Ax
+ By
+ Cz
= 0 (obsah
elipsy je P = ppq, kde
p,q jsou
délky
poloos elipsy).
Řešení. K určení obsahu elipsy
potřebujeme určit délky
jejích poloos. To jsou
vzdálenosti bodů
ležících zároveň
na elipsoidu i v řezné rovině,
které mají nejmenší, resp. největší vzdálenost od počátku. Vzdálenost bodu [x,y,z] od počátku je dána vztahem
. Místo této funkce budeme hledat
extrémy funkce u
= x2
+ y2
+ z2,
která se snáze derivuje, a
vypočtený výsledek odmocníme. Řešíme tedy úlohu
![]() |
![]() |
Tuto rovnici
můžeme
přepsat do tvaru kvadratické rovnice
2
+ K1
+ K2, kde
V tomto odstavci si ukážeme, jak lze v některých speciálních (ale poměrně často se vyskytujících) případech hledat vázané extrémy, aniž by bylo nutné použít aparát Lagrangeových multiplikátorů. I když je tento postup poněkud vzdálený od metod diferenciálního počtu, uvádíme jej zde pro jeho výbornou praktickou použitelnost. Čtenáři doporučujeme všechny úlohy tohoto odstavce vyřešit pro srovnání také metodou Lagrangeových multiplikátorů.
Nejprve připomeňme pojem kvadratického, aritmetického, geometrického a harmonického průměru n-tice čísel. Nechť x1 ,…,xn jsou kladná reálná čísla, označme
![]() |
![]() |
||
![]() |
![]() |
||
![]() |
![]() |
||
![]() |
![]() |
Věta 9.3. Nechť x = [x1,…,xn] je n-tice kladných čísel. Platí nerovnosti
Důkaz. Viz skriptum [H-K-S]. □
Kromě nerovností mezi průměry je účinným nástrojem i tzv. Cauchyova nerovnost.
Věta 9.4. Pro libovolné dvě n-tice reálných čísel x = (x1,…,xn),y = (y1,…,yn) platí
Důkaz. Viz [H-K-S]. □
Příklad 9.2. i) Mezi všemi trojúhelníky s konstantním obvodem o určete ten, který má největší obsah.
Řešení. Vyjdeme z Heronova vzorce pro obsah trojúhelníka
ii) Mezi všemi trojicemi kladných čísel x,y,z s konstantním součtem a najděte ta, pro která je součet převrácených hodnot minimální.
Řešení. Z nerovnosti mezi harmonickým a aritmetickým průměrem dostáváme
iii) Na elipsoidu
+
+
= 1 najděte bod v prvním oktantu
s vlastností, že objem
čtyřstěnu tvořeného
souřadnými stěnami a
tečnou rovinou
k elipsoidu
v tomto bodě je
minimální.
Řešení. Nejprve
připomeňme, že objem
čtyřstěnu vypočteme podle
vzorce V = x0y0z0, kde
[x0,0,0],[0,y0,0],[0,0,z0] jsou průsečíky tečné roviny se
souřadnými osami
(sestrojíme-li trojboký
hranol se základnou
tvořenou trojúhelníkem s vrcholy [0,0,0], [x0,0,0], [0,y0,0] a výškou z0, jeho objem
je
x0y0z0
a je trojnásobkem objemu
daného čtyřstěnu). Vyjádřením proměnné z z rovnice elipsoidu nebo pomocí derivace
implicitní funkce snadno
ověříme, že rovnice tečné roviny
k elipsoidu
v bodě [,,] je
![]() |
(9.9) |
Odtud
dostáváme, že úseky vyťaté tečnou rovinou na
souřadných osách jsou x0
= (položíme y = 0 = z v (9.9)),
z0 =
, z0
=
. Řešíme tedy úlohu
iv) Na elipsoidu
x2 + +
= 1 najděte bod, který
je nejblíže rovině
x +
y +
z =
2
.
Řešení. Pro vzdálenost bodu [x0,y0,z0] od roviny ax + by + cz = d platí vzorec (viz Příklad 9.1 ii))
![]() |
(9.10) |
která je (pokud jde o bod, v němž je dosaženo minima) ekvivalentní úloze
Cvičení
9.1. Určete vázané extrémy funkce f na množině určené rovnostmi:
a) f(x,y,z) = xy2z3, x + 2y + 3z = a, a,x,y,z > 0 |
b) f(x,y,z) = sinxsiny sinz, x + y + z = ![]() |
c) f(x,y,z) = xyz, x2 + y2 + z2 = 1, x + y + z = 0 |
d) f(x,y,z) = xy + yz, x2 + y2 = 2, y + z = 2, x,y,z > 0 |
e) f(x1,…,xn) = x12
+ ⋯
+ xn2, ![]() ![]() |
f) f(x1,…,xn) = ![]() ![]() ![]() ![]() ![]() ![]() |
g) f(x1,…,xn) = x1![]() ![]() ![]() |
[Další] [Předchozí] [Předchozí – na konec] [Na začátek] [Výše]