M3121 Pravděpodobnost a statistika I M4122 Pravděpodobnost a statistika II (prednášky) 1. Právdepodobnoštný prieštor M3121 je základny kurz teorie pravdepodobnosti, na ktorý nadväzuje M4122, v ktorom sú zýklády matematickej štatistiky. Skúšát sa bude lýtka obidvoch semestrov naraz v lete. CviCeniá sú velmi dôlezite. Podmienky získania kreditov v ZS: - maximúlne 2 neospravedlnene neúCasti na cviCeniach (prípadnú jedna ďalšia sa da kompenzovat spoCítaním príkladov) a súCasne - zisk minimalne 9 bodov z dvoch púsomiek (kazdú je ohodnotenú maximálne 10 bodmi). Histúriá (strucne) teorie pravdepodobnosti sa nújde na www.máth.muni.cz/^budiková/prf/historie.pdf Literatúra: DupaC, V., Huškova, M., Pravdepodobnost a matematická štatistika, Karolinum, Praha, 2001. Zvúra, K., Šítepán, J., Pravdepodobnost a matematická štatistika, Matfyzpress, Praha, 2001. Teória pravdepodobnosti je matematická disciplúna, ktora modeluje a popisuje náhodny pokus - pokus, ktorého vúsledok dopredu nepoznanie. Teda vúsledok pokusu nie je jednoznaCne urCeny podmienkami, za ktorých je realizovaný. Napr. hod kockou. Pokusy, ktorých výsledok je jednoznaCne dany podmienkami sa volajú deterministické. My budeme popisovat tzv. stochastické pokusy. Pritom presnejšie nas zaujúmajú take núhodne pokusy, pri ktorych je náhoda akúsi "regulúrná". Konkretne ak A je lubovolny sledovány naúhodnyú jav, tak poďzadujeme, aby vykazoval pri opakovanej nezúavislej realizúacii naúhodnúeho pokusu tzv. štatistickú stabilitu, t.j. aby relatívna poCetnost /n(A) = ^ n vyskytu javu A v postupnosti n nezávislych pokusov (pricom n a je pocet nastatí javu A) sa príliš nemenil a s rastucim n mal "tendenciu" drzat sa nejakej konštanty. Obrazne (nepresne) zapísane lim„^TO /n(A) = ř>(A). Toto neplatú (uúplne) napr. o futbalovom zaúpase, o predpovedi poďcasia, atdď. Budeme teda budovat matematickú teoriu - model nahodneho (štatisticky stábilneho) pokusu. Znaďcenie: Q ... Mnozina všetkych moznúch "najjemnejšúch" vysledkov nahodneho pokusu, ktoré ešte treba rozlišovat. Predpokladáme, ze vzdy Q je neprúzdna. Q volame priestor elementárnych javov. w ... Elementarny jav, prvok Q; Q moze byt konecna, spocútatelnú aj nešpoCítátelný; w je "najjemnejšú" vúysledok núahodnúeho pokusu. A, B, A1, A2,An ... náhodne javy (udalosti) 1 2 0 ... nemožný jav íl ... istý jav A U B ... jav, ktorý nastane ak nastane alebo A alebo B A n B ... jav, ktorý nastane ak nastane aj A aj B A — B ... jav, ktorý nastane ak nastane A a nenastane B A = Ac = íl — A ... opačný jav k javu A |J"=1 Ai ... nastane, ak nastane aspon jeden ž javov Ai,An {J°=1 Ai ... nastane, ak nastane aspon jeden ž javov A1, A2,... p|"= i Ai ... nastane, ak nastaný vsetký javý A1,An f]°=1 Ai ... nastane, ak nastaný vsetký javý A1, A2,... exp íl = 2n ... sýstem vsetkých podmnožin íl A C B ... ak nastal jav A, tak nastane jav B (A implikuje B) Pri nýhodnom pokuse okrem priestoru elementarných javov íl musíme mat žadaný (popísaný) aj sýstem nahodných javov. Definícia 1.1. Nech íl je lubovolna neprýždna množina. Nepráždný sýstem a podmnožin množiný íl sa nažýva a —algebra, ak platí (1.1) (i) A g a => Ac g a OO (1.2) (ii) A1 ,A2,... g a (J Ai g a (a—aditivita). i 1 Ukažuje sa rožumný požiadavka odražajýca nase skýsenosti, abý sýstem nýhodných javov a v popisovanom nýhodnom pokuse bol a—algebrou podmnožin množiný elementarných javov íl. Dvojicu (íl, a) nažývame javove pole a lubovolný prvok A g a nažývame náhodný jav (vžhladom k (íl, a)). Poznámka (íl, a) s volý aj meratelný priestor. Poznámka u— elementarný jav nie je nahodným javom, ale [uj] ako podmnožina íl je nahodným javom ak patri do a. Povieme, že nýhodný jav A nastal, ak (elementýrný) výsledok pokusu bol u, pricom u g A. S nýhodnými javmi narábame preto ako s množinami. Platia tu de Morganove vžorce (1.3) [jÄi=n Ai i>1 i>1 (1.4) f]Ai ^ Ai. i>1 i>1 (Dôkaž (1.3): u g \Jiy 1 Ai <=>■ u g U^ 1 Ai <=>■ v i > 1 platí u g Ai <=>■ v i > 1 platí u g Ai <=>■ u g Dôokaž (1.4) si urobte sami.) Veta 1.1. Nech (íl, a) je javove pole. Potom platí (1.5) l A, 0 A, 3 a pre lubovolne prirodzené n a A1,An, A, B G A n n (1.6) [JAi G A, p| Ai G A, A - B G A, i=i i=i a tiez oo (1.7) Ai,A2,... G A An G A. n=i Dôkaz: A je neprázdny systém, teda 3 A G A. Z (1.1) vyplýva, ze A G A. Z (1.2) vyplýva, ze ak A = A1 GA,A = A2 G A,A3 = A1,A4 = A1ltak A1 U A2 U A3 u ... = Q g a. Z (1.1) tiez Q = 0 g a. Dalej ak Ab A2,An G A a tiez 0 = An+1, 0 = An+2,... G a, tak z (1.2) A1 U A2 U ...An U0U ... = Un=1 Ai G A.___ _ Ak A1,A2, ...,An G A, teda A1 ,A2, ...,An G A, a [Jn=1 Ai G A, ale podla de Morganovho pravidla (1.4) je Uni=1 Ai = f|n=1 Ai a preto Ai G A, ale podla (1.1) Ai G A, pričom f|n=1 Ai = f|rn=1 Ai. Teraz nech A, B G A. Z (1.1) B G A az množinovej rovnosti A — B = A P\ B dostávame, ze A — B G A. Nech A1,A2G A. Preto aj A1,A2,... G A, teda [J°°=1 An G A a pomocou (1.1) a de Morganovych pravidiel aj U°°=1 An = f|°°=1 An G A. * Definícia 1.2. Majme postupnost nahodnách javov {An}n°=1. Hornou limitou postupnosti javov {An}n°=1 nazávame mnozinu všetkych w G Q, ktore patria do nekonecne vela javov An. Oznacujeme ju limsup^^^ An. (Inak povedane limsup^^^ An nastane práve vtedy ak nastane nekonecne vela javov An.) Definícia 1.3. Majme postupnost náhodnych javov {An}n°=1. Dolnou limitou postupnosti javov {An}n°=1 nazávame mnozinu vsetkych w G Q, ktore patria do vsetkách An s vynimkou konecneho poctu tychto javov. Oznacujeme ju liminfn^TO An. (Inak povedane liminfn^TO An nastane prave vtedy ak nastaná vsetky javy An s váynimkou kone cne ve la tyáchto javov.) Lema 1.1. Ak {An}n°=1 je postupnost náhodnych javov na (Q, a), tak liminfn^no An C limsupn^TO An. Dokaz: Zrejmy z definícií 1.2 a 1.3. Veta 1.2. Ak {An}n°=1 je postupnost náhodnych javov na (Q, a), tak platí nn (1.8) lim sup An = f] (J Ak, n n=1k=n nn (1.9) lim inf An = M f| Ak, n=1 k=n (1.10) lim sup An = lim inf An. n—>oo n ^no Dôkaz: w G limsup^^^ An w patrí do nekonecne vela javov An pre V n > 1 3 k > n, ze w G Ak n > 1 je w G [JZn Ak ^ w G C\n=1 UZn Ak. w G liminfn—no An w patrí do kazdej An s vynimkou konecneho poctu Ai 3 n > 1, ze w G f)ľ=n Ak <^ w G U°=1 Hľ=n Ak. w G limsup^^^ An neplatí, ze w patrí do nekonecne vela javov An neplatí, ze V n > 1 3 k > n, ze w G Ak 3 n > 1 V k > n w G Ak 3 n > 1 V k > n w G Ak 3 n > 1, ze w G f]ck°=n Ak wG U^fl k=n Ak = lim inf n—n An. * 4 Definícia 1.3. Majme postupnost náhodných javov {An]'^)=l. Povieme, že postupnost {An}'^)=l má limitu A, ak A = limsup^^^ An = liminfAn. OžnaCujeme A = limn^TO An. Poznámka. Ak A1,A2,... G A a 3 A = limsup^^^ = liminfn^TO = U^LiflT=n Ak G A (teda limita je ž A). Samozrejme ž Vetý 1.2 vyplýva, že aj limsup^^^ An G A a lim inf n^co An G A. Veta 1.3. Nech {An}cc=1 je postupnost nahodných javov na (lí, A). Ak A1 C A2 C .... Potom 3 linin^oo An a platí lmin^co An = Ucc=1 An. Dôkaž: p|c°=n Ak = An, preto w G liminfn^co An w g\Jc°=n Ak = U°=1 An, Ciže liminfn^co An = Un=1 An. Aj limsup^^^ An = yoc=1 An, lebo ž Lemý 1.1 |J°=1 An = liminfAn C limsup^^^ An a naopak ak w G limsupn^o An <=^ w patrí do nekoneCne vela An <=^ w G [J°=1 An, Ciže limsupn^o An C |J°=1 An. Preto 3 limn^co An = U°=1 An. * Veta 1.4. Nech {An}c°=1 je postupnost nahodných javov na (lí, A). Ak A1 D A2 D .... Potom 3 limn^oo An a platí lmin^co An = f|c=1 An. Dôkaž: (Jc°=n Ak = An, preto w G limsupn^co An w G f)c°=n Ak = f|°=1 An, ciže limsupn^oo An = n=1 An. Aj liminfn^co An = f|°°=i An, lebo ž Lemý 1.1 liminfn^co An C limsupn^o An = ílCC=1 An a naopak ak w G f]°=1 An w patrí do vsetkách An w G liminfAn, ciže f]°=1 An C lim infn^co An. Preto 3 limn^co An = f|°=1 An. * Veta 1.5. Nech S je nepráždný sýstem podmnožin lí. potom existuje množinová a—algebra a(S) taka, že platáí (i) S C a(S), (ii) ak je A* množinova a—algebra taka, že S C A*, tak a (S) C A*. Dôkaž: Položme a(S) prienik množinových a—algebier obsahujácich S. Potom S C a(S) a žrejme je a(S) aj a—algebrou. * Definícia 1.4. Nech S je nepráždný sýstem podmnožin lí, a(S) je prienik množinovách a—algebier obsahujácich S. a(S) sa nažýva minimálna množinová a—algebra generovaná systémom S. Borelovske množiný. Polo žme lí = (—oo, oo) = R, S = {(—co,x>, x G R} C explí = expR Minimálna množinová a—algebra a(S) = B generovana sýstemom S sa vola borelovské (množinova) a—algebra v R. Jej prvký sa nažávajá borelovske množiny. Požnamenávame len, že borelovská a—algebra v R je totožná aj s minimalnou množinovou a—algebrou generovanou sýstemom množín S vsetkých intervalov tvaru < a, b), kde a < b (požri napr. Riecan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972, str. 46). 5 Analogicky definujeme Bn. Q = Rn, S = {(—to, xi > x... x (—00, xn >, xi, ...,xn G R}, a (S) = Bn je borelovská (množinová) a—algebra v Rn. Definícia 1.5. (Axiomatická definícia pravdepodobnosti.) Nech (Q, A) je javove pole a P realna množinová funkcia definovaná na A s vlastnostami (i) P (Q) = 1 (normovana) (ii) V A G A P (A) > 0 (nežaporna) (iii) ak {An}^==i je postupnost po dvoch disjunktních (nežlucitelnách) náhodných javov (t.j. V n An G A : An n Am = 0 pre n = m), tak P (Uľ=i) = Eľ=i P (An) (a—aditívna). Potom funkciu P nažívame pravdepodobnosťou (na A) a trojicu (Q, A, P) pravdepodobnostnám priestorom. Poznámka. Axiomatická definíciu pravdepodobnosti a pravdepodobnostný priestor žaviedol N.A.Kolmogorov v roku 1933. Poznámka. Pravdepodobnostný priestor je matematickým modelom (regularneho) náhodneho pokusu. Príklad 1.1. Nech Q je konecná množina elementárnych javov, t.j. Q = {oji, ...,ojn}, A = expQ. Pre A = {uj^ ,...,Wik} C Q nech P (A) = YJj=1 P (Wiä}), pricom V i P ({wJ) > 0, Yln=1 P({wí}) = 1. Potom (Q, A, P) je pravdepodobnostný priestor. Špeciálne: Ak v Príklade 1.1 je P({wí}) = n pre i = 1, 2, ...,n, tak hovoríme o klasickom pravdepodob-nostnom pokuse (klasickej definácii pravdepodobnosti, klasickom pravdepodobnostnom priestore), pricom P (A) = |Q| (|A| je pocet elementarných javov v A). Váhová definácia pravdepodobnosti: Nech Q je nanajvýs spoďtatelna množina, teda Q = wn,...}, A = expQ, P (A) = £ UJj eA P ({wíj }), pricom V n P ({on}) = Pn > 0 ^ ~=i P ({wn}) = 1. Geometricka definácia pravdepodobnosti: Nech Q G Bn je borelovska množina, ktorej Lebesgueova miera /x(Q) je konecná a kladna, A = Bn(Q) (sýstem vsetkých borelovských podmnožán Q), pravdepodobnost P (a) = pre A ga. 6 2. Vlastnosti pravdepodobnosti Veta 2.1. Nech (íl, A, p) je pravdepodobnostny priestor. Potom pravděpodobnost p ma nasledujúce vlastnosti: (i) p (0) = o (ii) a, b G A, a n b = 0 => p (a U b) = p (a) + p (b) (iii) a, b G A, a c b => p (b - a) = p (b) - p (a) (subtraktívnost) (iv) a, b G A, a c b p (a) < p (b) (monotónnost) (v) a G A => 0 < p (a) < 1 (vi) a G A p (a) = 1 - p (a) (vii) a, b G A => p (a U b) = p (a) + p (b) - p (a n b) (viii) au an G A => p (Uľ=i ai) = Eľ=i p(ai)- - EITi1 En=m p (ai n aj) + EITi2 E^Z+i ELj+i p (a n aj n afc) +...+ +(-i)n+ipn a2 n ... n an) (ix) ai,an G A => p (Un=i ai) < £ n=i p (ai) (i) p (Q) = p (Q U 0 U ...) = p (Q) + p (0) + ... = 1 => p (0) = 0; (ii) a, b G a, a n b = 0 => p (a U b U0U ...) = p (a) + p (b) + p (0) + ... = p (a) + p (b); (iii) , (iv) a,b GA, a c b => b = a U (b - a) (nezluCitelne). Teda p(b) = p(a) + p(b - a) a preto p (b - a) = p (b) - p (a), ale aj p (a) = p (b) - p (b - a). Keďže p (b - a) > 0, je p (b) > p (a); (v) a G A, 0GA, 0C a c Q => (z (i),(iv)) 0 = p (0) < p (a) < p (Q) = 1; (vi) a G a, a U a = Q => (z (ii)) 1 = p (Q) = p (a U a) = p (a) + p (a), Ciže p (a) = 1 - p (a); (vii) a, b G A, teda sada písat a U b = [a-(a nb)] U(anb) U [b-(an b)] (disjunktne) p (aUb) = p(a - (a n b)) + p(a n b)+ p (b - (a n b)) = (z (iii)) p (a) - p (a n b)+ p (a n b)+ p (b) - p (a n b) = p (a) + p (b) - p (a n b); (viii) indukciou pomocou (vii) (pozri napr. RieCan, B., O pravdepodobnosti a miere, Alfa, Bratislava, Dokaz: 1972) p P (U V, ai) + p (An) -X- ai) + p (an -1) - p Ai) + P (An) Ai) + P (An - i) P (Ai U A2) = P (A i ) + P (A2) - P (Ai n A2) < P (Ai) + P (A2) a sďtaním mame P (|Jn=i A,) < P(Ai) + P(A2) + ... + P(An). * 7 Veta 2.2. Nech (íl, A) je javove pole, P realna mnozinova funkcia definovana na A s vlastnostami (i) P (í) = 1 (ii) V A G A P (A) > 0 (iii) A, B G A, A n B = 0 P (A U B) = P (A) + P (B) (aditivita, nie a—aditivita) Potom nasledujuúce vlastnosti suú ekvivalentnúe (1) P je pravdepodobnost na (íl, A) (2) Ai ,A<2,... G A, An C An+1 linin^oo P (A„) = P Ai) = P (liím^z A„) (spojitost zdola) (3) Ai ,A2,... GA,An D An+i lim„^TO P (An) = P (f| 0=1 Ai) = P (linin-z A„) (spojitost zhora) (4) Ai, A2,... G A, An D An+i^ n=1 An = 0 limin^z P (An) = 0 (spojitost zhora v 0). Dôokaz: (1) => (2) P je a—aditívna, teda ak Bi, B2,... G A, Bi n B j = 0 pre i = j P (|J °=i Bi) = E °Zi P (Bi). Polozme Bi = Ai, B2 = A2 — Ai, B3 = A3 — A2,.... Platí U°= i Ai = U°= i Bi a Bi n Bj = 0 pre i = j. Dostavame P (U= i Ai) = P (U= i Bi) = Eľ= i P (Bn) = limn^n EL i P (Bi) = limn^oo[P (Bi) + P (B2) + ... + P (Bn)] = lmin^oo[P (Ai) + P (A2) — P (Ai) + ... + P (An) — P (An-i)] = linin^oo P (An). (2) => (3) _ _ _ _ _ An D An+i, preto An C An+i a podla (2) limin^z P (An) = P ({JZ i Ai) = P (iX i A) (de Morgan) = 1 — P (fľ= i An). Teda liím^z P (An) = limn^z[1 — P (An)] = 1 — [1 — P i An)] = P (0°= i An). (3) => (4) Ak Ai, A2,... G A, An D An+i, UZ=i An = 0, taklimn^z P(An)= P (u°=i Ai) = P(0) = 0. (4) => (1) Nech Bi, B2,... G A. Platú Bi n Bj = 0 pre i = j. ďalej platú P (|Jo=i Bi) = P (Bi U ... U Bn-i U Jo=n Bi). Ak oznacime |J°=n Bi = Cn, potom Cn D Cn+i a f|z=i Cn = 0 (lebo f|o=i Cn = f|^ U°=n Bi = limsup^^^ Bn = {w G íí : w patrí do nekonecne vela Bi} = 0, lebo Bi su po dvoch disjunktne). Teda podla (4) limin^z P (Cn) = 0. Pocítajme pre lubovolne n > 2: P (U°=i Bi) = EITi1 P (Bi) + P (Cn) (aditivita P). Preto plat í: P (U=i Bi) = lmwz P (U°=i Bi) = limn^z[Enľi1 P (Bi) + P (Cn)] = limn^z E n-i1 P (Bi) + limn^z P (Cn) = E°=i P (Bi). * 8 Veta 2.3. Nech (íl, A, P) je pravdepodobnostny priestor, An G A, n =1, 2,... a existuje limn^o An = A. Potom P (linin^oo An) = linin^oo P (An). Dôokaž: Pre realnu číselnú postupnost {an}oo=i platú: a je hromadnym bodom {an}o°=i ak a je limitou nejakej vybranej podpostupnosti ž postupnosti {an}o°=i. Množina hromadnych bodov každej realnej postupnosti ma najvacsú a najmensú prvok. Najvacsú prvok je limsup^^^ an a najmensú prvok je liminfan. Postupnost {an}oo=i ma limitu prúve vtedy ak limsup^^^ an = liminfn^o an = limn^o an (Jarnúk, V., Diferenciúlm pocet II, Academia, Praha, 1976). Dalej ožnacme p| o=n Ai = Bn, U °Ĺn Ai = Cn, P (B n) = bn,P (Cn) = Cn. Zrejme Bn Q Bn+i, Cn 2 Cn+i, n =1, 2,.... Podla Vety 2.2 3 limin-o bn = limin^oo P (Bn) = P (U °Li Bn) a podla Vety 2.2 3 lirrin^oo Cn = limn^o P(Cn)= P(Hľ=i Cn). Z predpokladov vety tiež A = limn^o An = lim inf An = lim sup^^^ An. Počítajme: P(limn^oo An) = P(liminfn^o An) = P (Uľ=i nľ=n Ai) = P (Uľ=i Bn) = limin^oo P (Bn) = lmin^oo bn = liminfn^oo bn = lim inf n^oo P (fl °=n Ai) < liminf n^oo P (An) < limsupn^o P (An) < limsupn^o P (U o=n Ai) = limsupn^o P (Cn) = limsupn^oo Cn = lmin^oo Cn = limin^oo P (Cn) = P (f| °Li Cn) = P (iX^ U °Ĺn Ai) = P(limsupn^o An) = P(lmin^oo An). Preto vsade platú rovnost a P(limn^o An) = liminfn^o P(An) = limsupn^o P (An) = (Jarnúk) lmin^oo P (An). * Veta 2.4. (Borelova-Cantelliho lema) Nech An, n = 1, 2,... je postupnost nahodnych javov na (íl, A, P) a E °°=i P (An) < c. Potom P (limsupn^oo An) = 0. Dôokaž: 0 < P(limsupn^oo An) = P (fT=i [JZn Ai) = lillln^oo P ([JZn Ai) (Veta 2.2, lebo Ai}~i je kle- sajúca postupnost. Platú tiež: Ai = An U An+i U ... = An U (An+i — An) U (An+2 — Un+n1 Ai) U (An+3 — Un+n2 Ai) U — An, An+2 — Uni=+n^l Ai,... sú disjunktne. Preto limn^oo P (U=n Ai) = lmin^oo P ((An U (An+i — An) U (An+2 — Ai) U ...)) = limn^oo(P (An)+ P (An+i — An )+ P (An+2 — Ai ) + -) < limn^oo EZ=n P (Ai) = = limn^oo(E°=i P (Ai) — En=_ii P (Ai)) = E°=i P (Ai) — Eo=i P (Ai) = 0. Teda P(lim supn_>.oo An) = 0. * 9 3. Podmienená pravděpodobnost Príklad 3.1. Majme urnu s a čiernymi a b bielymi gulkami. Gulku po vytiahnutí nevrátime spät. Označme náhodný jav Bi - v prvom tahu vytiahneme bielu gulku B2 - v druhom tahu vytiahneme bielu gulku Zaujíma nas pravdepodobnost , s akou v druhom t ahu vytiahneme bielu gulku, ak vieme, ze v prvom t ahu sme vytiahli bielu gu lku. Rie senie: P (Bi ) = OTb- Podobne P (B2|Bi) = -+——1T. a + b — 1 Označenie P(B2|Bi) znamená podmienená pravdepodobnost nahodneho javu B2 ak nastal náhodná jav Bi. Platáí tie z P (Bi n B)= (a + b)(a + b — 1), lebo vs etkáčh moz ností (vásledkov) dvoch t ahov je b(b — 1 + a) + a(b + a — 1) = b2 — b + ab + ab + a2 — a = (a + b)(a + b — 1) a "priaznivych" b(b — 1). (bii,bi2) (bii,bi3) ... (bii,bib) (bii, č i) ... (bii, č0) (bi2,bii) (bi2,bi3) ... (bi2,bib) (bi2, č i) ... (bi2, čo) (bib,bii) (bib,bi2) ... (bib,bib-i) (bib,či) ... (bi b, čo) Môžeme ale pásat ( či,bii) ( č i,bi2) ... ( či,bib) ( č i, č2) ... ( či, č o) ( čo,bii) ( č o,bi2) ... ( čo,bib) ( č o, č i) ... ( či, č o-i) b(b-i) P(B B ) P(B2 h Bi) (o+b)(o+b-i) b — 1 P(B2IBi) = —UÍD ,— =-b-= —rr—t. P (Bi) o+b a +b — 1 Teda ohraničili sme sa namiesto na Bi (bii,bi2) (bii,bi3) ... (bii,bib) (bii, č i) ... (bii, čo) (bi2,bii) (bi2,bi3) ... (bi2,bib) (bi2, č i) ... (bi2, čo) (bib,bii) (bib,bi2) ... (bib,bib-i) (bib, či) ... (bi b, čo) a z náhodneho javu B2 berieme "len tu č ast , ktorá je v Bi". 10 Definícia 3.1. Majme pravdepodobnostný priestor (íl, A, P) a B G A je vybraný náhodný jav taký, že P (B) > 0. Podmienená pravděpodobnost náhodneho javu A G A ža podmienky nastatia nahodneho javu B je (3.1) P (A|B) = P(p^. Poznámka. Z (3.1) vypláva (3.2) P (A n B) = P (A|B)P (B) pričom sa predpokladá, že P (B) > 0. Pretože A n B C B, teda P (B) = 0 P (A n B) = 0, vžtah (3.2) má výžnam aj pre P (B) = 0. Vžtah (3.2) je "symetrický" aj pre A, teda (3.3) P (A n B) = P (B|A)P (A). Z (3.2) a (3.3) máame (3.4) P (A|B)P (B) = P (B|A)P (A). Ožnačenie: Nech jav B G A je pevne daný, pričom P (B) > 0. Definujme Pb : A^< 0,1 > Pb(A)= P(A|B). Veta 3.1 PB je pravdepodobnost na (íl, A) (pre každá jav B, pre ktorý je P (B) > 0). Dokaž: Pb (l)= P (B) = P(B) = 1, Pb (A)= PP(B)B) ^ 0pre V A G A A„ G A, n =1, 2,Ai n Aj = 0 pre i = j, potom P (m A \ = P (U~i Ai n B) = P (LJ~i(A n B)) = Pb [VAi) = P(B) = P(B) = = Ei=i P(Ai n B) = £ p(Ai|B) = £ Pb (Ai). * Veta 3.2 Platí (i) P (A|íl) = P (A) pre V A G A (ii) P (fX=1 A,) = P(Ai)P(A2|Ai)P(As|A2 n Ai)...P(A„|Ai n A2 n ... n An-1) ak P (pg-1 A>) > 0 (veta o násobení pravdepodobnosti). Dokaz: (ii) Z (3.2) je P (Dti Až) = P (An nfirJi1 = p (a^ niTi1 a,) p (ft-1 At) = P (An| pn-11 A) P (A*-1 n pn-12 = 11 p (An\n:-1 p ít=í a) p (nr=ľ a) P(Ai)P(A2\Ai)P(A3A2 n Ai)...P(An\Ai n A2 n ... n An_1). * Definícia 3.2. Majme pravdepodobnostný priestor (íl, A, P). Náhodné javy A1 ,A2,... G A tvoria úplný systém javov, ak platí oo (3.5) Ai n Aj = 9, i = j, a [JAi = íl i=i Poznámka. úplný systém javov môže byt aj konečný. Veta 3.3. (Vžorec pre úplnú pravdepodobnost) Nech Ai, A2,... je úplný system javov v pravdepodob-nostnom priestore (íl, A, P) taky, že (3.6) P (Ai) > 0, i = 1, 2,.... Potom platí o (3.7) P (B) = ]T P (B\Ai)P (Ai). i=i Dokaž: P (B) = P (B n í) = P (B n U°=i Ai) = P (U°=i(B n Ai)) = YZi P (B n Ai) = £°=i P (B\A)P (Ai) (podla (3.2)) * Veta 3.4. (1. Bayesov vžorec) Nech Ai,A2,... je úplny system javov v pravdepodobnostnom priestore (í, A, P) takú, že P (Ai) > 0, i = 1, 2,.... Ak P (B) > 0, tak platí (3 8) P (A B) = P (B\AJ)P (AJ) ň = 1 2 (3.8) P (Aj\B)= E°=i P (B\Ai)P (Ai), j = 1, 2,.... Dôokaž: Pre lubovolne j je pomocou (3.2) a (3.7) P (A B) = P (B n Aj) = P (B\Aj )P (Aj) P (Aj\B) P (B) E °=i P (B\Ai)P (Ai). * Veta 3.5. (2. Bayesov vžorec) Nech Ai,A2,... je úplny system javov v pravdepodobnostnom priestore (í, A, P) takú, že P (Ai) > 0, i = 1,2,.... ďalej A G A, že P (A) > 0 a B g a. Platí (39) P(BA) = PiAnA>} P(Ai)P(A\Ai)P(B\A n Ai) () P (B\A)= E°=i P (A\Ai )P (Ai) ■ Doôkaž: spravte si sami Poznámka. Vety 3.3, 3.4 a 3.5 platia aj v prípade, že úplny system javov je konecny. Poznámka. P (Aj) v Bayesovúch vžorcoch sú tžv. apriorně pravdepodobnosti a P (Aj\B) aposteriorne pravdepodobnosti (po vykonaní pokusu s vysledkom B). Poznaámka. V prúípade 1. Bayesovho vžorca ide o rieďsenie situaúcie, kedď maúme hypotúežy Ai, ... , ktorúe sa navžajom vylucuju, ale vycerpavajú vsetky možnosti. Požnúme ich (apriorne) pravdepodobnosti P(Ai). Nastal jav A a požnúme pravdepodobnosti P(A\Ai). Pútame sa na (aposteriorne; nove, ktore berú do úvahy skutocnost, že mastal A) pravdepodobnosti P(Ai\A) 12 V prípade 2. Bayesovho vzorca ak nastal jav A, pýtame sa na pravděpodobnost javu B. Poznámka. Nie je vzdy jednoduchě volit správny pravdepodobnostný model pre výpoCet podmienených pravdepodobností. Príklad 3.2. (Lekírska diagnostika) Vieme, ze urCitou (konkrétnou) chorobou Ch trpí 1% populície. Choroba je diagnostikovana na zíklade vysetrenia, ktorého spolahlivost je (i) 95% ak vysetrovaný osoba trpí chorobou Ch (ii) 70 % ak vysetrovana osoba netrpí chorobou Ch. Vysetrujeme nýhodne zvolený osobu. Urcte pravdepodobnost správnej diagnózy, ak vysledok vysetrenia je (a) pozitívny (podla vysledku vysetrenia je osoba chorá) (b) negatívny (podla vysledku vysetrenia je osoba zdraví). Riesenie: Oznacme jav A - vysetrovaní osoba trpí chorobou Ch (je chorá) B - vísledok vysetrovania je pozitívny Zo zadania vieme P (A) = 0.01 (pravdepodobnost, ze vybrana osoba je chorá) Tato pravdepodobnost sa volí prevalencia alebo tiez apriorní pravdepodobnost choroby Vysetrenie (spolahlivost vysetrenia) sa charakterizuje dvomi charakteristikami, a síce pravdepodobnostou P(B|A) = 0.95 tzv. citlivost testu alebo aj senzitivita testu pravdepodobnostou P(B|A) = 0.7 tzv. specificita testu. (a) Mame urcit vlastne P(A|B) (lebo v tomto prípade vísledok testu bol pozitívny, teda test hovorí, ze vysetrovana osoba je chorí (diagníza je, ze pacient je chory) a my mame urcit pravdepodobnost správnej digníozy). Zo zadania vieme, ze P (A) =0.01, P (A) =0.99, P (BiA) = 0.95 a P (B|A) = 1-P (B|A) = 1-0.7 = 0.3. Podla Bayesovho vzorca (A, A su hypotézy) n,lim P (A) P (BA) 0.01 • 0.95 P(A|B) =-K J K ^-=-= 0.030995. V 1 ' P(A)P(B|A)+ P(A)P(B|A) 0.01 • 0.95 + 0.99 • 0.3 Je to aj aposteriírna pravdepodobnost, ze pacient je chory, ak vysledok testu bol pozitívny. Je to prekvapiví vysledok. cakali by sme "omnoho lepsí" vísledok. 13 Celkom máme 29 700 + 950 = 30 650 pozitívnych výsledkov, z toho správne pozitívnych je 950, čiže P (A\B) = -950- = 0.030995. v 1 ' 30650 _ (b) Analogicky (zase A, A sú hypotezy) P(A)P(B\A) 0.99 • 0.7 P (A\B) = —=-—- ( \ )—=-=-= 0.99928. V 1 ' P(A)P(B\A) + P(A)P(B\A) 0.99 • 0.7 + 0.01 • 0.05 Je to aposteriórná pravdepodobnost, ze pacient nie je chory, ák vysledok testú bol negatívny. Naozaj celkovo mame 69 300 + 50 = 69 350 negatívnych vysledkov, z toho spravne negatívnych je 69 300 a teda _ __ 69300 pravdepodobnost spravnej diagnózy ú negatívnych vysledkov testú je P(A\B) = = 0.99928. 69350 Nezavislost nahodnych javov Definícia 3.3. Majme pravdepodobnostny priestor (lí, A, P). Nahodne javy A, B G A só nezávislé (vzhladom k pravdepodobnosti P) ak P (A n B) = P (A) P (B). Definícia 3.4. Majme pravdepodobnostny priestor (lí, A, P). Nahodne javy Ai, A2,... G A só skupinovo (združené) nezávislé (vzhladom k pravdepodobnosti P) ak pre lúbovolne k G {1, 2,...} a lúbovolnó skúpinú indexov ik} C {1, 2,...} platí p (n )=n p (aíj ). \j=i / j=i Nahodne javy A1,A2,... G A só po dvoch nezávisle, ak kazde dva só nezóvisle. Poznámka. Zrejme lúbovolnó jav A G A a jav isty í só nezóvisle. Takisto lúbovolny jav A G A a jav nemoznó 0 só nezavisle. Poznámka. Pozor, je rozdiel medzi disjúnktnómi (nezlúcitelnymi) javmi (nemozú naraz nastat, A n B = 0 ) a nezaóvislyómi javmi (tú treba pravdepodobnos t). Príklad 3.3. V úrne só 4 lístky {000,110,101,011}. Nóhodne javy Ai — {nóhodne vytiahnúty lístok mó na i— tom mieste 1}, i = 1, 2, 3, súó po dvoch nezaóvislóe, ale nie súó (zdrú zene) nezóavislóe, lebo P (Ai) = P (A2) = P (As) = 2 P (Ai n A2) = P (Ai n A3) = P (A2 n A3) = 4 P(Ai n A2 n A ) = 0. Veta 3.6. Nech Ai, A2,An G A só zdrúzene nezavisle javy. Platí (i) lúbovolnó postúpnost Ai, A2,An, kde Alk = Ak alebo Ak = Ak je postúpnost zdrúzene nezavislych javov; (ii) P (ULi Ak) = 1 — nn=i (1 — P (Ak)). Dokaz: (i) Ak Ai , A2 súó nezaóvislóe, tak P (Ai n A2) = P (Ai — (Ai n A2)) = P (Ai) — P (Ai n A2) = 14 = P(Ai) - P(Al)P(A2) = P(Ai)(1 - P(A2)) = P(AÍ)P(A2), teda Ai,A2 sú nezávislé. Tak isto P(Ai n A2) = P((Ai u A2)) = 1 - P(Ai u A2) = 1 - P(Ai) - P(A2) + P(Ai n A2) = = 1 - P(Ai) - P(A2) + P(Ai)P(A2) = (1 - P(Ai))(1 - P(A2)) = P(AT)P(A2), čiže aj Ai a A2 sá nezávislé. Dokaz dokončíme indukciou (pozri Riečan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972, alebo Dúpač, Húskova, Pravdepodobnost a matematicka statistika). (ii) Z de Morganových pravidiel a z (i) (n \ / n \ / n \ n U Ak) = P LU* = WRA^ - P (Ak)). * k = i J \k=i J \k=i J k=i Veta 3.7. (Borelova lema) Nech Ai,A2,... G A je postupnost nezávislých javov, t.j. . Potom P (lim súp An) = 0 V 1 podla toho, ci rad VJ°=i P(An) konverguje alebo diverguje. Dokaz: Ak VJcc=i P(An) < x P(limsúp^^^ An) = 0 podla Borelovej-Cantelliho lemy (Aj ani nemusia byt nezáavisláe). Ak Eľ=i P(An) = x, tak P (limsúpn^co An) = P (Hľ=i Uľ=n A* ) = P (Rľ=i Bn) = (kde Bn = UC=n A* 2 Bn+i) = (Veta 2.2. (3)) lum^cc P (Bn) = (Bn = An U (An U An+i) U (An U An+i U An+2) U ...) = (Veta 2.2. (2)) lin^co [lim*—c P (iJ^ A*) (de Morgan) limn—co lim*—c Wflk=n A* oo 1 - P (ílk=n a*) = (nezávislost) 1 - lmin^oo lim* ^^Ilfc=n P (A* )J = = 1 - limn^c lim* —c E! k=n (1 - P (A*)) > 1 - limn^c lim* —c e-^ k=n P (Ak) (lebo 0 < P (A*) = x* < 1 a 1 - x* < e-Xk, teda f] *=n (1 - x*) < [I *=n e-Xk, cize -nľ=n(1 - x*) > - nLne-xk = -e-^P(Ak)). Pretoze VJ c°=i P (An) = x, cize lim*—c J2 n=i P (An) = x a aj lim*—co VJ*=* P(An) = x pre kazde n. Teda limn—c lim*—c J2 n=* P (An) = x a limn—co lim*—c e-^ N=k P (An) = 0. Dostávame P(limsúp^^^ An) = 1. * 15 4. Náhodná velicina Snažáme sa vásledok pokusu výjadrit cáslom (pocet padnutých sestiek na 10 kockach; doba po ktorá svieti žiarovka; pocet bakterií v jednotkovom objeme vodý; atd.). Snažíme sa "pretransformovať' výsledok pokusu, nahodne javý na císelná os. Pravdepodobnostná priestor "žobražit" na císelná os tak, abý sa dala spocítat pravdepodobnost vsetkám "rožumným" množinám reálných cásel. Teda chceme nájst vhodne žobraženie (Q, A, P) — R pricom prepokladáme, že (Q, A, P) máme dane, urcene napr. verbálne (slovne). Ukažuje sa rožumne vžiat na realnej osi borelovská a—algebru B a hladat vhodne žobraženie X : (Q, A) - (R, B) tak, abý sme mohli spocátat (udat) pravdepodobnost každej borelovskej množiný B G B. Zadefinujme si takuáto "vhodnuá" funkciu. Definícia 4.1. Majme daná pravdepodobnostný priestor (Q, A, P). Realnu funkciu X definovaná na Q pre ktoruá platá (4.1) V B G B g Q: X (w) G B} G A nažávame náhodná veličina. Nahodná velicinu niekedý voláme aj nahodna premenná. Funkciu X splšujácu (4.1) nažývame meratelná funkcia, prvký a—algebrý B meratetoe množiny. Množinu {w G Q : X(w) G B} žapisujeme (skrátene) {X G B} alebo {X-i(B)}. Je žrejme, že náhodnou velicinou X žobražáme elemenárný výsledok pokusu w na realne cáslo. Kecl sa žrealižuje elemenarný jav w, tak realižacia nahodnej veliciný je (realne cáslo) x = X(w). Kecl máme žadaná (urcená) náhodná velicinu X, tak pre každu borelovská množinu B G B vieme urcit {w G Q : X(w) G B} = {X-i(B)}. specialne pre každe reálne císlo x je {w G Q : X(w) G (—o,x)} = {X Fx(a). (ii) Pre lubovolne (ale pevne) x nech {xi}oZ1 je akakolvek postupnost takí, ze konverguje zlava k x (teda \imXn^x-). Nech Ai = {w : X (w) < x i} a A = {w : X (w) < x}. Zrejme |J o=1 Ai = A, Ai C Ai+i. Zo spojitosti zdola pravdepodobnosti dostaívame Fx (x) = P (A) = P (M Ai) = lim P (A) = lim Fx (xí). ii i 1 (iii) Vezmime lubovolní {xi}o=1 takí, ze xn —> —x. Pri oznacení Bn,An z (ii) tentokrat Ai D Ai+1 a n°=1 Ai = 0. Preto lim Fx (xn) = lim P(An) = P( lim An) = P(0) = 0. n—^oo n—^oo n—^oo 17 Ak teraž vežmeme lubovolnu {xi}o=1 taká, že xn — oo. Pri ožnačení An ž (ii) je Ai c Ai+1 a lim Fx (xn) = lim P (An) = P = P (ll) = 1. * Veta 4.2. Pre distribučná funkciu Fx platí (4.3) P ({X = x}) = Fx (x + 0) - Fx (x), x g R. (Fx(x + 0) = limyix+ Fx(y) (limita sprava).) Dokaž: Platí {X < x} = {X = x} u {X < x} ra rak vežmeme lubovolná {xi}o=1 taká, že xn — x+, tak {X < x} = n°=1{X < xn}, pričom {X < xn} d {X < xn+1}. Zo spojitosti pravdepodobnosti žhora platí P ({X < x})= p(J^){X< xn}^J = nlim P ({X < xn}) = lim F(xn) = Fx (x + 0), n (pričom žo spojitosti pravdepodobnosti žhora vyplýva, že limnioo P ({X < xn}) existuje a je jedina pre akákolvek postupnost {xi}o=1 taká, že xn x + ). Preto P ({X = x}) = P ({X < x}) - P ({X < x}) = Fx (x + 0) - Fx (x). * Dôsledok. Fx (•) je spojita v x práve vtedy ak P ({X = x}) = 0 (lebo Fx (•) je žlava spojitá vždy a sprava práave ak P({X = x}) = 0). Veta 4.3. Distribu čnaá funkčia máa najviač spo čitate lne ve la bodov nespojitosti (skokov). Dokaž: Ožnačme Cn = { množina bodov, v ktorýčh ma Fx(•) skok väčsí ako n }. Velkost skoku v bode x je vlastne (podla (4.3)) Fx (x + 0) - Fx (x) = P ({X = x}) a Cn = {x g R : P ({X = x}) > n}. Pretože hodnoty pravdepodobnosti ležia v intervale < 0,1 >, môže mat Cn najviač (n-1) prvkov. Mno žina bodov o C = {x : Fx(•) ma v bode x nejaká skok} = Cn. n=2 Pretože C je spočitatelnám žjednotením konečnáčh množín, je nanajvýs spočitatelná. * 18 Lebesgueova - Stieltjesova miera Strucne si povieme o Lebesgueovej - Stieltjesovej miere. Majme danu reúlnu funkciu F s vlastnostami (i) neklesajuúca (ii) spojitúa žďlava. Majme system S vsekych intervalov tvaru < a, b), kde a < b. Potom je množinovú funkcia /i definovanú na S predpisom /i(< a, b)) = F (b) — F (a) a—aditívna. (dôkaž požri napr. Riecan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972, Veta 5.2.1). Z teorie miery potom existuje prave jedna miera /iP definovanú na systeme B vsetkúch borelovskych množní taka, že /ip (< a, b)) = F (b) —F (a) (dokaž požri napr. Riecan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972, Veta 5.2.2). Miera /ip sa nažúva Lebesgueova - Stieltjesova miera indukovana funkciou F. Dú sa ukúžat, že ak navyse platú, že limx^ _ o F (x) = 0, limx^o F (x) = 1, tak /ip je pravdepodobnost na (R, B). Požnamenúvame len, že ak ža funkciu F (•) žvolúme funkciu F (x) = x, tak /ip sa volú Lebesgueova miera. Poznaámka. Lebesgueova-Stieltjesova miera sa žavúadža vďseobecnejďsie pre funkcie F ktorúe suú neklesajuúce a spojitúe žďlava (nemusia byďt len distribuďcnúe funkcie). Pre naús je dôoleďžityú prúpad kedď F je distribuďcnúa funkcia. Poznámka. Ak mame nahodnú velicinu X a jej distribucnú funkciu FX, tak na systeme S intervalov < a, b), kde a < b je Px (< a, b)) = P ({a < X < b}) = Fx (b) — Fx (a) = /px (< a, b)) a preto pravdepodobnostnú miera /ip je totožnú s roždelenúm pravdepodobnosti PX (podrobnejsie požri napr. v Rieďcan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972). Z teoúrie integraúlu pre kaďžduú B G B je PX(B) = \iPx (B) = / d/P'X (x) (Lebesgueov-Stieltjesov integrúl) = J B = / d/iPx = / dFX (x) (ine žnacenie). BB Platú aj nasledujúca veta ("opak" Vety 4.1): Veta 4.4. Nech F je neklesajúca, spojitú žlava a limx^ _ o F (x) = 0, limx^o F (x) = 1. Potom existuje nahodnú velicina X tak, že F je jej distribucna funkcia. Dokaž: Povedali sme, že /iP je pravdepodobnost na (R, B) a preto (R, B,/iP) je pravdepodobnostnú priestor. Definujme teraž na R nahodnú velicinu X vžtahom X (x) = x. Je žrejme, že X je núhodnú velicina, lebo ak B G B, tak X_i(B) = B je borelovskú množina. Nech G je distribucna funkcia nahodnej veliciny X, potom G(x) = /p({X_i((—co, x))) = /p(( co, x)) = = lim /iP (< x — n, x)) = lim (F (x) — F (x — n)) = F (x) — lim F (x — n) = F (x). Teda F je distribucna funkcia núhodnej veliciny X. * 19 5. Diskrétne nahodne veličiny (náahodnáe veli činý diskráetneho týpu) Nahodným veličinám žodpovedajá určite distribučne funkčie (teda aj určite Lebesgueove-Stieltjesove miery). Definícia 5.1. Nečh {pí}0=1 je rad kladnýčh čísel takýčh, že °=1 Pi = 1 a M = {xi}o=1 je (lubovolna) postupnost rožnyčh realnyčh čísel. Funkčia (xi,pi)o=1 na {xi}o=1 sa nažýva pravdepodobnostná funkcia. Požnamenajme len, že postupnosti {xi} a {pi} možu byt aj konečne. Poznámka Pravdepodobnostná funkčia može byt čhápana aj ako (xi,pi)iej, kde J je konečna alebo spočitatelna indexova množina. Veta 5.1. Nečh (xi,pi)o=1 je pravdepodobnostna funkčia. Položme F(x) = 5ľ pi. Potom je funkčia F neklesajuča, spojitá žlava a limxi-o0 F (x) = 0, limXioo F (x) = 1 (teda distribučná funkčia). Dokaž: Nečh x < y. Potom F (y) - F (x) = J2{xv X 0, teda F (y) > F (x). Nečh je x pevne číslo. Nečh e je ľubovolne kladne číslo. Pretože o=1 Pi = 1, existuje take n, že J2 0 tak, aby sa v (x - ô, x) nenačhadžalo žiadne ž čísel x1, ...,xn-1. Potom pre y g (x - ô, x > je o F (x) - F (y) = J2 Pi m0 je zm < zmo). Preto \/m > m0 je 0 < F(zm) < F(zmo) = ^2{x-: x-1 konverguje {F(zm)}m>1 k nule. Nečh {zn}n°=1 je (lubovolná) taka rastáča postupnost, že limniM zn = to. Ožnačme čard{xi : xi < zn} = jn. Zrejme linin^oo j n = to. Pretože £ n=1 Pi = 1, platí lim F (zn) = lim Pi = lim Pi = 1. * nio nio nio xí 0, pritom pre tieto hodnoty je P ({X = xi}) = Pi a pre lubovolne x g {x1,x2,...} je P ({X = x}) = 0. Samožrejme platí pre lubovolne x g R, že P ({X = x}) = F (x + 0) - F (x). 20 Predchadzajóce úvahy majó aj takó interpretaciú, ze ak mame realnú fúnkciú X, ktoró nadobóda hodnoty z mnoziny M = {xi,x2,...} s pravdepodobnostami P ({X = xi}) = pi, pricom pi > 0, i = 1,2,... a Si=iPi = 1, tak X je nóhodna premennó s rozdelenóm pravdepodobnosti (5.1). Príklady diskrétnych nahodnóch veliďn Nahodna velicina s alternatívnym rozdelenóm pravdepodobnosti (Alternatóvne rozdelenie pravdepodobnosti) Majme M = {0,1}, (teda xi = 0, x2 = 1) a ďalej pi = 1 — ô, p2 = ô, pricom ô g< 0,1 >. Nazveme 0— neúspech a 1—óspech. Potom fúnkcia X (schvalne nehovoríme kde je definovana), ktoró nadobóda hodnoty 0 a 1 s pravdepodobnostami P (X = 0) = 1 — ô a P (X = 1) = ô je nahodna premenna. Rozdelenie pravdepodobnosti tejto nóhodnej premennej sa nazyva álternatévne rozdelenie pravdepodobnosti s parametrom ô a póseme X ~ A(ô). Modelújeme (matematicky popisújeme) nóm sitúóciú, ked móme pokús s dvomi moznymi vysledkami - "úspechom" a "neóspechom". Pravdepodobnost úspechú je ô a neóspechú 1 — ô. Jej distribúcna fúnkcia je Lahko skonstrúújeme v tomto prípade priestor elementórnych javov íí = w2} a a—algebrú nóhodnych javov a = {{0}, {wi}, {w2}, íí}. Pravdepodobnost P({0}) = 0, P = 1 — ô, P ({w2}) = ô, P (íí}) = 1. Nóhodnó velicina X je definovana nasledovne: X (wi)=0, X (w2) = 1. 21 Pravda, toto všetko už "nepotrebujeme". Stačí nám poznat pravděpodobnostmi funkciu náhodnej veličiny X. Binomicke rozdelenie pravdepodobnosti Majme M = {0,1, 2, ...,n} (teda x1 = 0,x2 = 1, ...,xn+1 = n) a px+i = p(x) = ^n^6x(1 — 6)n-x > 0 pre x = 0,1, 2,n, 6 G< 0,1 >. Zrejme n+1 j = 1 x=0 v 7 n )6x(1 — 6)n-x = [6 + (1 — 6)]n = 1. x Nahodna veličina X, ktora nadobáda hodnoty {0,1, ...,n} s pravdepodobnostami P (X = x) = ^ J6x(1 6)n-x, x = 0,1,...,n má binomické rozdelenie pravdepodobnosti s parametrami n, 6. Označujeme X ~ Bi(n,6). Ak uvažujeme experiment, ktory pozostáva z n nezavislých alternatívnych pokusov, v ktorách nas zaujíma len nastatie alebo nenastatie náhodneho javu A (pravdepodobnost nastatia javu A v jednotlivom alternatívnom pokuse je 6 G< 0,1 >), potom X — pocet nastaná nahodneho javu A v experimente je x x = 0,1, 2..., n, je diskrétna náhodná velicina a X ~ Bi(n, 6). Dokazte to ako cvicenie. Poissonovo rozdelenie pravdepodobnosti \x Majme M = {0,1, 2,} a px+1 = p(x) = e-X — > 0 pre x = 0,1, 2,6 > 0. Zrejme x! CO co -x 00 \x j = 1 x=0 x=0 x Nahodna velicina X, ktora nadobáda hodnoty {0,1,...} s pravdepodobnostami P (X = x) = e-X—-, x = x! 0,1,..., má Poissonovo rozdelenie pravdepodobnosti s parametrom A. Oznacujeme X ~ Po(A). Takato náhodna velicina popisuje napríklad váskyt "riedkych javov", pocet organizmov v jednotke pody, pocet listov na strome, pocet haváriá, pocet prerusená vyroby, pocet hovorov v telefánnej sieti, atd. Veta 5.1. (Poissonova) Ak Xn ~ Bi(n,pn), kde limn—Co npn = A> 0, pn G (0,1) a X ~Po(A), tak pre k = 0,1, 2,... platá lim P ({Xn = k})= P ({X = k}). n—o Dokaz: Pre k = 0,1, 2,... platá lim P({Xn = k})= lim ffka — pn)n-k n—C n—C k 1 npn(n — 1)pn...(n — k + 1)p^ n Ak _x n—C k! (1 — pn)k k! lebo (1 — pn)n=|1 1 22 Negatívne binomické rozdelenie pravdepodobnosti a geometrické rozdelenie pravdepodobnosti Majme M = {0,1, 2,..., } a px+1 = p(x) = (X + r ^ pr (1 - p)x = r — 1 pr (1 — p)x > 0 pre x = 0,1, 2,p G (0,1), r G N. Z Taylorovho rozvoja (MacLaurinov rad) funkcie (1 — z)-fc = Eľ=o ľ(1 k=° ^x = = £°=o (* + J — ^ ^', k G N, |z| < 1 zrejme 00 / , -i \ OO r 1 r 1 pr (1 — p)x = pr v fx +r — M(1 — p)x = pr (1 — (1 — p))-r = 1. /x + r — 1\ Nahodna velicina X, ktora nadobúda hodnoty {0,1,...} s pravdepodobnostami P (X = x) = í \pr (1 — p)x, x = 0,1,..., ma negatívne binomické rozdelenie pravdepodobnosti s parametrami r,p. Oznacujeme X — NeBi(r,p). Ak uvažujeme experiment, ktorý pozostava z nezavislych alternatívnych pokusov, v ktorých nas zaujíma len nastatie alebo nenastatie nahodneho javu A—ýspech (pravdepodobnost nastatia ýspechu v jednotlivom alternatívnom pokuse je p G (0,1)), potom je diskretna nahodna velicina a X — NeBi(r,p) s hodnotami x = 0,1, 2,. Dokazte to ako cvicenie. Speciílnym prípadom negatívneho binomickeho rozdelenia pre r = 1 je geometrické rozdelenie pravdepodobnosti. Níhodný velicina X, ktorí nadobída hodnoty {0,1,...} s pravdepodobnostami P (X = x) = p(1— p)x, x = 0,1,p G (0,1), mí geometricke rozdelenie pravdepodobnosti s parametrom p. Oznacujeme X — Ge(p). Ak uvazujeme experiment, ktorí pozostava z nezívislích alternatívnych pokusov, v ktorych nís zaujíma len nastatie alebo nenastatie nahodneho javu A—íspech (pravdepodobnost nastatia uspechu v jednotlivom alternatívnom pokuse je p G (0,1)), potom je diskrétna náhodná veličina, X ~ Ge(p) s hodnotami x = 0,1, 2,... . Hypergeometrické rozdelenie pravdepodobnosti Majme N G N, (N > 2) sáčiastok, z ktorách je A G N chybnách, pričom N > A. Zo vSetkách N sáčiastok náhodne vyberieme n G N súciastok (bez vratenia), pricom n < N. Nahodna premenná X poScet neuspechov, ktor e predchadzaju r t emu uspechu X poScet neuíspechov pred prvíym uíspechom X poScet chybnyích suíSciastok medzi n vytiahnutíymi mí hypergeometrické rozdelenie pravdepodobnosti s parametrami N, A, n. Oznacujeme to X — Hg(N, A, n). Samozrejme musíme sa presvedcit, ze takto popísaní funkcia X je skutocne níhodna premenní a definovat hypergeometrickíe rozdelenie pravdepodobnosti. 23 Najprv si uvedomme, že môžu nastat práve 4 prípady, a síce (i) n < A, n < N — A (poCet dobrých súčiastok) vtedy X nadobúda hodnoty x g {0,1, ...,n} (ii) n < A, n > N — A vtedy X nadobúda hodnoty x g {n — (N — A) N + A (najmenej chybných), n — N + A + 1, ...,n (najviac chybných) } (iii) n > A, n < N — A vtedy X nadobuúda hodnoty x g { 0, 1 , ... , A} (iv) n>A, n>N — A vtedy X nadobúda hodnoty x g {n — N + A,n — N + A +1,...,A} Teda x— pocet chybných súciastok medži n vytiahnutymi je ž intervalu < k1, k2 >, kde k\ = max(0, n — N + N A) a k2 = min(A, n). Pocet možnych vytiahnutych n—tíc je ( ). Medži n vybratymi súciastkami (teda vo vybratej n—tici) je x chybnych ( ] x bežchybnúch, teda N n A sposobmi a ku každému sposobu je ÍN — A Nn—xA n — x možností vybratia (5.2) x g< max(0,n — N + A),min(A,n) >. P ({X = x}) Ax Nn — xA Dokaž toho, že (5.2) je roždelenie pravdepodobnosti vyplyva ž identity (5.3) min{n,A} E a=max{0,n-N +A} (N — A)(A) = (N) ktorú dokažeme pomocou nasledujucej lemy. Najprv si ale žadefinujeme klesajuci faktoriúl realneho císla x. Ak k g N0, x g R, tak klesajúci faktoriúl x(0) = 0 a pre k g N je x^k) = x(x — 1)...(x — k +1). Teraž kombinacne (ni\ s. n(k) f n\ císlo II možeme písat ako —kJ- a "rožsírili" sme pojem kombinacneho císla II tak, že namiesto n g N0 možeme uvažovat n g R (samožrejme k g N0 žostúva v platnosti). Lema 5.1 Pre lubovolne realne císla x, y a n g N0 platí (5.4) k)\n — k) \ n J (Cauchyho kombinatoricky vžorec). Dokaž: 1. Pre n = 0 je identita žrejmaú. 2. Nech teda platúí pre nejakúe n g N a dokúa žeme, že n+l (5.5) k=0WU + 1 — k) \n +1J Vieme, že pre lubovolne a g R, n g N0 je f a \ = a — n ŕa\ teda f x + ^ = x + y — n f x + y\ n + 1 n + 1 n n + 1 n + 1 n preto po cúítajme x+y+—inÍb(xx) (n—^ = nriŽ[y—n+k+x—^(l) (n—k) k n k n + 1 k=0 v 7 v 7 fc=0 =n 24 = nri{ É(k) (n-k)y-j++k(n - k+ +1 (n-k)("+»}= = t(X)(n - k +l)(n - k + » + É (k + l))n-k)(k + «} = = (X)(n^l)(n + l) + g (X)(n-k + l)(n-k + +g(t+l)(n-k)(k+l)+(,.: l)(x)(n+lj= = n+l{ (X)(n + l)(n + + Ž (X)(n - k + l)(n - k + + É (X ((n J + + (n +l)(X)(n = = n+T )(j)(n + l)(n + g (k)(n-k +l)(n + + (n + l)(X)(n = g (X)(n +1 - k) = (n + í)* 25 6. Spojite nahodne veliciny (nóahodnóe velidciny (absolúótne) spojitóeho typú) Najprv si zopakújeme úrdcitóe tvrdenia z matematickej analyzy tyókajúóce sa absolúótne spojitej fúnkcie. Definícia 6.1. Fúnkcia F(•) je absolótne spojita (na R), ak k lúbovolnemú e > 0 existúje take ô > 0, ze pre kazdó postúpnost ai kone cnúó varióaciú, t.j. súpXJ=i \F(xj) — F(xj-i)\ < oo, pricom súpremúm sa berie cez vsetky N a konecne postúpnosti a = x0 < xi < ... < xN = b. Teraz si zadefinújeme absolútne spojitó nahodnó velicinú. Definícia 6.2. Povieme, ze nóhodnó velicina X definovanó na (íí, A, P) je ábsolUtne spojitého typu (spojitá), ak existúje (nezóporna) integrovatelnó fúnkcia f (•) taka, ze pre kazdó borelovskú mnozinú B G B je Px(B)= í f (x)dx. J B Fúnkciú f nazyóvame hustotou rozdeleniá právdepodobnosti (hustotou) nóahodnej veli ciny X. Veta 6.1. (Vlastnosti hústoty.) Nech X je naóhodnóa veli cina absolúótne spojitóeho typú, f je jej hústota a F jej distribú cnóa fúnkcia. Potom (i) I-oo f (x)dx = 1; (ii) F(x) = f (t)dt; (iii) F( • ) je absolúótne spojitaó fúnkcia; (iv) hústota f (•) je úrcena jednoznacne skoro vsade vzhladom k Lebesgúeovej miere, t.j. ak f a g só hústoty nahodnej veliciny X, tak ^({x : f (x) = g(x)}) = 0, kde ^ je Lebesgúeova miera; (v) existúje F '(x) skoro vsade vzhladom k Lebesgúeovej miere ^ a fúnkcia g(x) = F'(x) je hústota nóahodnej velidciny X; (vi) pre a 0 pre kazde x G R skoro vsade vzhladom k Lebesgúeovej miere. Dokaz: 26 (i) Ak má X hustotu f, tak z definície aboslútne spojitej náhodnej veličiny vyplýva, že V B G B Px(B) = f b f (x)dx. Ak vezmeme B = R, tak 1 = Px ({R}) = /R f (x)dx = f (x)dx. (ii) Vieme, že F (x) = P ({X < x}) = Px ((-oo,x)) = f (t)dt. (iii) Tvrdenie z matematickej analýzy: Ak pre funkciu F platí F (x) = J"_^ f (t)dt pre každe x G R, tak F je absoluútne spojitúa na R. (iv) Ak f a g sú hustoty núhodnej veličiny X, tak pre kazdú B G B platí Px (B) = /B f (x)dx = /B g(x)dx. Z toho dostúvame, ze pre kazdú B G B platí (f (x) — g(x))dx = 0, čize ^({x : f (x) = g(x)}) = 0. (v) Tvrdenie je dôsledkom absolútnej spojitosti ((ii) vlastnost absolútne spojitej funkcie). (vi) Podla Vety 4.1., Vety 6.1.(ii) a aditívnej vlastnosti integrúlu platí P ({a < X < b}) = F (b) — F (a) = /-oo f (t)dt — f (t)dt = a f (t)dt. Distribucnú funkcia F je absolutne spojita, preto je spojitú a pre kazde x G R podla (4.3) platí P (X = x) = 0, z coho lahko dostaneme ostatne vztahy. (vii) Ak napíseme pre lubovolne h > 0 a x take, ze existuje F'(x) = f (x) ^ = P {ix-h ^X b. Interpretacia takejto nahodnej veliciny je núzornú: Istota (jednotkovú pravdepodobnost) je na intervale (a, b) rovnomerne "rozprestrena". 27 Náhodná velicina s exponencialnym rozdelením Nech nahodny jav A sa vyskytúje v nahodnych okamzikoch (napr. prerúsenie vyroby, vyhorenie ziarovky, prelet castice, atd.) Váskyty tohto náhodneho javú A v neprekryvajácich sa casovách intervaloch sú nezavisle. Oznacme Q (t) - pravdepodobnost, ze sledovany jav A nenastane v priebehú casoveho intervalú dlzky t Ak ti,t2 sá dlzky dvoch na seba nadväzújácich casovych intervalov, tak Q(ti +12) = Q(ti)Q(t2) P {A nenastane v priebehú casú ti a súcasne nenastane v priebehú casú t2}. Nech Q je diferencovatelná fúnkcia casú a pre t = 0 nadobúda maximúm, teda Q(0) = 1. Pre t> 0, At > 0 je ln Q (t + At) =ln Q(t) + ln Q(At), cize pre t > 0 je (ln Q(t))' = lim ln Q(t + At) - ln Q(t) = lim lnQAt) = ľ ln Q(0 + At) - ln Q(0) n = Altimo+-At-= [ln Q(t)]t=0 = -X (ide o deriváciú sprava, ktorú oznacíme -A, pricom X > 0). Máme teda diferencialnú rovnicú s pociatocnoú podmienkoú d ln Q(t) --- — — A dt Q(0) = 1. Jej riesenie je Q (t) = e-Xt. Oznacme X - nahodná velicinú - cas, ked nastane prvykrát sledovany jav Zrejme FX (t) = P ({X < t}) = P (jav A nastane v case (0,t)) = 1 - Q (t) (túnaá Q(t) je pravdepodobnosdt, dze sledovanyá jav nenastane v intervale (0, t)), teda Í1 - e-xt, ak t> 0 Fx (t) = { 0, ak t < 0. Náhodná velicina X ma exponenciálne rozdelenie pravdepodobnosti s parametrom A a oznacújeme X ~ ex( A). Jej hústota je ÍAe-Xt, ak t> 0 fx (t)= { 0, ak t < 0 (dostaneme derivovanám F). 28 Náahodnaá velidcina s normáalnym rozdelenáím (normaálna náahodnaá velidcina, gaússovskáa náahodnáa velidcina) Ak máa naáhodnáa velidcina X hústotú (x - j)2 f (x) = -=L- e 2a2 , j G (-x, x), a2 > 0, tak povieme, ze X má normálne (Gaussovo, gaussovské) rozdelenie pravdepodobnosti s parametrami j, a2 a píseme X ~ N (j, a2). V prípade j = 0 a a =1 ide o standardizovánu normálnu náhodnU veličinu, co oznacújeme X ~ N(0,1). Jej hústota je x2 f (x) = —L e-T. Normaálne rozdelenie máa náahodnaá velidcina, ktoraá vznikla súádctom vedlkáeho podctú nezáavislyách náahodnyách velidcáín (o rozdelenia ktoryách stadci predpokladadt úrdcitáe vedlmi vdseobecnáe predpoklady). Normaálne rozdelenie maá vedlmi dolezitá álohú v teorii pravdepodobnosti a matematickej statistike. Napríklad normálne rozdelená je nahod-na chyba meracieho prístroja, chyba pri strelbe na ciel, telesná vyska jedincov homogennej popúlácie, atd. Poznamenavame len, ze skútocnost, ze f (x) je hústota vyplyva z rovnosti JO*3 e-a x dx = -2~> a > 0. Náahodnaá veli cina s gama rozdelenáím Ak máa naáhodnáa veli cina X hústotú í #re-axxp-i, ak x> 0 f (x) = \ r(p) ' 0, ak x < 0 a > 0, p > 0, tak povieme, ze X ma gama rozdelenie pravdepodobnosti s parametrami a, p. Gama fúnkcia r(a) je definovaná predpisom r(a) = /J" xa-ie-xdx, a > 0. Jej najcastejsie poúzívane vlastnosti súá r(a + 1) = aľ(a), ľ(2) = -n, ľ(n) = (n - 1)! pre n G N. 5. Náhodna velicina s beta rozdelením Ak máa naáhodnáa veli cina X hústotú í -řt-k; xa-i(1 - x)b-i, ak0 0, 6 > 0, tak povieme, ze X má beta rozdelenie pravdepodobnosti s parametrami a, 6. Beta fúnkcia B(a, 6) je definovaná predpisom B(a, l gama a beta fúnkcioú je vyjadrenyá nasledovne: B(a, 6) Beta fúnkcia B(a, 6) je definovaná predpisom B(a, 6) = fQ xa i(1 - x)b idx, a > 0,6 > 0. Vztah medzi 0i r(0a)r(6) r(a + 6) 29 Poznamka o distribucnych funkciach Diskríetne a spojitíe níahodníe veliSciny (resp. distribuScníe funkcie diskríetnych a spojityích níahodnyích veliScín) predstavují dve prakticky velmi dolezite triedy. Vo vseobecnosti ale o distribucnych funkciach platí veta (nebudeme ju dokazovat, pozri napr. Rudin, W., Analyza v realnem a komplexním oboru, Academia, Praha, 1977) Veta 6.2. Nech X je nahodní veliclna s distribucnou funkciou F. Potom F sa dí napísat v tvare F (x) = aiFa(x) + a2Fa (x) + a3Fs(x) ai,a2,a3 > 0,a1 + a2 + a3 = 1, pricom Fa(-) je distribucní funkcia diskretnej níhodnej veliciny, Fa(-) je distribucna funkcia absolutne spojitej níhodnej veliciny a Fs(-) je distribucní funkcia singulírne spojitej níahodnej veliSciny. Povieme, Sze F je singulíarne spojitía, ak je spojitía a pritom existuje borelovskaí mnoSzina B Lebesgueovej miery 0 a miery 1. Takato funkcia ma skoro vsade (vzhladom na Lebesgueovu mieru) derivíciu rovní 0 a je spojita v R. Napríklad Cantorova funkcia je spojití, diferencovatelní, rastíca, derivaciu mí nuloví s víynimkou mnoSziny Lebesgueovej miery 0. Takíato funkcia funkcia je spojitía a nie je absoluítne spojitía. 30 X : Q — Rn, 7. Nahodne vektory Mame často nielen jednu náhodná veličinu, ale sáčasne niekolko nahodnýčh veličín. Zaujíma nas, či niektoré ž ničh spolu "akosi" suvisia, či (žname) hodnoty jednej nahodnej veličiny (resp. určitej skupiny náhodnýčh veličín) vedia niečo povedat o hodnote inej náhodnej veličiny (inýčh nahodnáčh veličín). Snažíme sa vysetrovat (aj) žávislost. Potrebujeme model, v ktorom pračujeme s niekolkými nahodnými veličinami suá časne. Zopakujme si: (Q, A, P) je pravdepodobnostný priestor X : Q — R, pre ktorá platí x G R => {w G Q : X(w) < x} G A je naáhodnaá veli čina. Rožsírme na mnohorožmerný prípad: (Q, A, P) je pravdepodobnostný priestor /X1(-A X2(") \Xn(-)J a ožnaľčme [X < x] = {w G Q : X^w) < x1, ...,Xn(w) < xn}. Bn nečh je najmensia a-algebra nad intervalmi tvaru (-TO,x1) X (-TO,x2) X ... X (-TO,xn) pre lubovolne x G Rn (t.j. x = (x1,xn)'). Nažývame ju borelovská a-algebra v Rn. Definícia 7.1. Majme pravdepodobnostný priestor (Q, A, P). Realna vektorová funkčia X(-) definovana na Q s hodnotami v Rn, pre ktoruá platáí x G Rn [X < x] G A sa nažýva náhodný vektor (vektor náhodnýčh veličín, n-rožmerná nahodna veličina, vektorova nahodna veliľčina). Definícia 7.2. Nečh X = (X1,Xn)' je n-rožmerný náhodný vektor definovaný na pravdepodobnos-tnom priestore (Q, A, P). Reáalnu funkčiu F (x1,x2 ,...,xn) = P (X1 < x1, ...,Xn < xn) = P ([X < x]) definovaná pre každe x G Rn nažývame distribučnou funkciou náhodneho vektora X. Ožnaľčenie: A^F (x1,...,xn) ) - F(x1,xn) je diferencia funkčie F v premennej xi s krokom h > 0. ďalej ožnačme rekurentne Ah-A^.F (x1,...,xn) = A%[A%F (xu...,xn)] = Ahj [F(x1, xi—1, xi + hii xi+1, — ^ xn) F(x1i - ^ xn)] F(x1, xi + hi, xú + hj, xn) F(x1, xú + hÚ, xn) 31 [F...1Xi + hi1 xn) Fxn)] Ahi Ahj F(x1J xn). Vlastnosti distribučnej funkcie popisuje nasledujúca veta Veta 7.1. Distribučná funkcia Fx n—rozmerneho nahodneho vektora mú tieto vlastnosti: (i) liim^oo, l 0, (k = 1, 2, n) platí Ah^-A^F(x1,...,xn) > 0. Dokaz najdeme napr. v (Dupač, V., Huskova, M., Pravdepodobnost a matematickú statistika, Karolinum, Praha, 2001 alebo Renyi, A., Teorie pravdepodobnosti, Academia, Praha, 1972). Poznámka. Platí A^-A^F(Xi, ...,Xn) = P (j][Xi < Xi 0,x2 > 0,x1 + x2 > 1a F(x1,x2) = 0 inak, potom F(x1, x2) je neklesajúca v kazdej premennej a A(11) a12)F(0,0) = A(11) [F(0,1) — F(0, 0)] = F(1,1) — F(0,1) — F(1,0) + F (0, 0) = 1 — 1 — 1 + 0= —1, co nemôze byt (podla predchúdzajúcej poznamky) P (0 < X1 < 1,0 < X2 < 1), ci ze túato funkcia F nie je distribu cnou funkciou. Analogicky ako v jednorozmernom prípade definujeme Lebesgueovu-Stieltjesovu mieru ^p indukovanú distribucnou funkciou F na borelovskúch mnozinach Bn (polozíme pre n—rozmernú interval < a1,b1 )x < a2 ,b2) x ...x < an,bn), kde a,i < bi, i = 1, 2,...,n, mieru \ip ({< a1 ,b1 )x < a2,b2) x ...x < an,bn)}) = A^L,A™ -A™ F(a1,...,an) a jednoznacne ju rozsírime na vsetky borelovske mnoziny v Rn tak, aby miera n rozmernyúch intervalov bola zachovanúa). Platúí aj nasledujuúca veta: Veta 7.2. Nech funkcia F(x1,...,xn) splna podmienky (i)-(iv) Vety 7.1. Potom existuje pravdepodob-nostnú priestor (lí, A, P) a n—rozmerný núhodny vektor X tak, ze Fx = F. Dokaz vety je analogicky ako v jednorozmernom prípade. Definícia 7.3. Distribucna funkcia F (n premennúch) sa nazyva diskrétna, ak existuje konecna alebo spocitatelna postupnost M = {xm}meJ, kde J je konecna alebo spocitatelna indexovú mnozina (pricom xm G Rn su navzajom rôzne) a zodpovedajúca postupnost kladnych císel {pm}m^J tak, ze £meJpm = 1 a F (x) = Yl x 0 pre skoro vsetký x G Rn (vzhladom na Lebesgueovu mieru), f f (x)dx = 1, (ii) pre kazdá B G Bn platá PX(B) = JB f (x)dx, dn ~ (iii) f (xi,xn) = —--— F (xi,xn), pricom derivacia existuje skoro vsade vzhladom k Lebesgueovej axi...axn miere. Príklad 7.2. Náhodne vektorý absolutne spojiteho týpu (s distribucnámi funkciami absolátne spo- jitýámi). n— rozmernýá rovnomernýá naáhodnáý vektor X máa hustotu , \XSl=i pre xi G (ai,Pi), i = 1,2,...,n f (xi,x2, ...,xn) = < 0 inak, pricom ai,(3i G R, ai < (3i, i = 1, 2,...,n. Oznacujeme X ~ Ron(ai,pi, ...,an, (3n). n—rozmerná normalne rozdelený nahodný vektor X (náhodná vektor s regularným normálným rozde-lenám) máa hustotu f (xi,x2,xn) = f (x) =-1 , e— i (x—^Y^-1(x—^), kde fi = /j,n)', ni G R, i = 1, 2,...,n a S je pozitávne definitná matica. Znacime X ~ Nn (/lx, S). 33 Margináalne naáhodnáe vektory Nahodná jav [X < x] môžeme písat aj ako p|n=i[Xi < x^. Ak si zvolíme pevne j G {1, 2,..., n}, tak pre (lúbovolná) postúpnost xj* — x je Ai = f] [Xi < xj] n [Xj < xj1'] c A2 c i = i j = j a postúpnost náhodnách javov Ai,A2,... má limn—co An = |Jc=i A* G A, pricom (7.1) A*= *=i *=i H [Xi U ti- J 34 (b) Nech X je spojitú núhodnú vektor s hustotou f (x). Potom marginúlny núhodnú vektor X* ma hustotu /oo poo ... I f (x1, xrn)dxy\ ...dxyn—k , -oo J —oo kde {yi,...,yn—k} = {1, 2,..., n} — {ii, ...,ik}. Dokaž: Dokažeme si len tvrdenie (b) (tvrdenie (a) si dokažte ako cvicenie). Platí F*(x*) lim xyi — oo F(x1, xn) lim xyi — oo ľ-J J — oo J — oo f (tl, ...,tn)dti...dtn teda xyn—k — o r xň rxík Xyn — k -oo J—oo L*'—oo J—oo f (t 1, ^n')d^'yi ...dtyn — k\ dtii ...dtik i /oo poo "Z f (t1, ^n)d^yi ...dtyn—k f (tii, ^ik ) --oo J —oo * — oo 8. Nežavisle núhodne veliciny Definícia 8.1. Povieme, že núhodne veliciny X1,X2, ...Xn sú ždružene nežúvisle, ak pre každú n—ticu realnych císel x1 ,x2, ...,xn platí P (X1 < :C1,X2 < x2, ■ Xn < xn) = P (X1 < x1)P (X2 < x2 )...P (Xn < xn )■ Veta 8.1. Nech nahodny vektor X = (X1, Xn) ma distribucnu funkciu F (x) a nech FXi (xi) je distribucna funkcia marginalnej nahodnej veliciny Xi, i = 1, 2, ■■■,n. Potom X1, Xn su ždružene nežavisle prave vtedy, ak F (x) = ľ] rn=1 FXi (xi) pre vx g Rn. Dokaž: X1, ■■■Xn su ždružene nežavisle vx = (x1, xn)' g Rn je P (C\n=1{Xi < xi}) = nn=1 P ({Xi < xi}) ^ vx = (x1, ■■■,xn)' g Rn je F (x) = F (x1, xn) = P ({X1 0, inak. Pretoze V (x,y)' G R2 platí f x, y(x,y) = fx(x) • fY(y), su X a Y nezavisle. (b) hustota (X, Y) je Íc, ak (x.y) G G 0, inak. Teda i i—x ^ i 1 = fx Y ( x, y) dxdy = c dy dx = c (1 - x) dx jg J Jo Uo j ./o r 2 ] i x 2 x2 = c I x-- 2 C c = 2. 2 Marginalne hustoty su ff. flZo fx,Y (x,y)dy = 2 JQ1—x dy = 2 [y]0—x = 2(1 - x), ak x G< 0,1) 0, inak. Analogicky Í2(1 - y), ak y G< 0,1 > fY(y) = < 0, inak. Platí, ze V (x,y)' G< 0,1)x < 0,1 > okrem j(x,y) : x G< 0, \ >, y = 2j——xx)} je fx,Y (x,y) = f x (x)-fy (y). Mnozina na ktorej fx,Y (x, y) = fx (x) • fY (y) je kladnej Lebesgueovej miery (nie je Lebesgueovej miery 0). Preto X a Y nie su nezavisl e. 9. Rozdelenie pravdepodobnosti transformovanych nahodnych veliďc ín Veta 9.1. Nech X je nahodna velicina a h borelovsky meratelna funkcia. Potom h(X) je nahodna veliďcina. Dokaz: Nech B G B je lubovolna borelovska mnozina. Oznacme h—i(B) = {t G R : h(t) G B}. Pretoze h je borelovsky meratelna, je h—i(B) G B. Potom ale {ca G Q : h(X(w)) G B} = {ca G Q : X(w) G h—i(B)} G A. * Veta 9.2. Nech zobrazenie h : Rn —> Rm je borelovsky meratelne, t.j. VB G Bm je {x = (xi,xn)' G Rn : h(xi,...,xn)' G B}GBn. Nech X = (Xi,Xn)' je n-rozmerný nahodny vektor na (f2, A, P). Potom Y = h(X) je m-rozmerny nahodny vektor. Dôkaz: Nech B G Bm. Potom z meratelnosti h vyplyva, ze h-i(B) = {X G Rn : h(X) G B} G Bn. Preto {w G Q : h(X(w)) G B} = {w G Q : X(w) G h-i(B)} G A. * 37 V ďalšom sa budeme zaoberat rozdelením pravdepodobnosti transformovaných náhodných veličín, resp. transformovaných nahodných vektorov. Poznámka. Pracovat budeme s Lebesgueovým integrálom z borelovský meratelnej funkcie y vzhladom k Lebesgueovej-Sieljesovej miere na borelovskej mnozine A, t.j. budeme pracovat s integrálom I = í h(x) = det d h äx7 /Shi det dxi dhi \ Ak oznacíme y = h(x), teda yi = hj(x), i =1, 2,n, tak povieme, ze zobrazenie h je regulárne na mnozine MC Rn ak (i) M je otvorená, (ii) funkcie h1, ...,hn majá spojite prve parciálne derivacie na M, (iii) Vx g M platí, ze L>h(x) = 0. Zobrazenie h je prostá na M, ak platá xi g M, x2 g M,xi = xi h(xi) = h(x2). Veta 9.4. (Veta o substitácii.) Nech h je zobrazenie otvorenej mnoziný P c Rn na Q c Rn, nech h je regularne a proste zobrazenie na P s Jakobianom _Dh. Nech M c Q je borelovska a H : Rn — R reálna 39 meratelná a integrovatelna funkcia. Potom platí f H(y)dy = í H(h(x))|Dh(x)|dx. JM Jh-1(M) Dôkaz: Jarník, V., Integrální poCet NCSAV, Praha, 1955. Bezprostredným dôsledkom tejto vety sá nasledujáce dve vety. Ich dokazy najdeme napr. v Andei, J., Matematicka statistika, SNTL/Alfa, Praha, 1985. Veta 9.5. (Veta o hustote transformovaneho náhodneho vektora.) Nech nahodný vektor X = (Xi, ...,Xn)' má hustotu fx(x), x G rn. Nech h je zobrazenie rn do rn, ktore je regularne a proste na otvorenej mnoZine G, pre ktorá platá JG fx(x)dx = 1. Ak h-1 je inverzne zobrazenie k h, potom ma náhodný vektor Y = h(X) hustotu f y (y) tvaru ífx(h-1(y))|Dh-1 (y)|, ak y G h(G) fY(y) = < I 0, inak. Veta 9.5a. (Zovseobecnena veta o hustote transformovaneho nahodneho vektora.) Nech nahodný vektor X = (X1, ...,Xn)' má hustotu fx(x), x G Rn. Nech h je zobrazenie rn do rn, ktore je regulárne a proste na disjunktnách otvorených mnozinach G1,G2,... a zobrazuje ich na h(G1), h(G2),pricom platá platá Jq fx(x)dx = 1, kde G = |Jj=1 G j. Ak oznacáme h-1 inverzne zobrazenie k h : G j — h(Gj), j = 1, 2, potom má náhodná vektor Y = h(X) hustotu fY(y) tvaru f y (y) = Ej=1 f j (y), kde ff. ; fx(h-1(y))|Dh-i (y)|, ak y G h(Gj) 0, inak. Ukazeme si dva prákladý Príklad 9.3. Nech X = (X1, ...,Xn)' je nahodná vektor absolátne spojiteho týpu s hustotou fx. Nech A je regularna matica týpu n x n. Najdite hustotu nahodneho vektora Y = AX. Riesenie. A je regularna a preto zobrazenie y = h(x) = Ax je regulárne na otvorenej G = rn, Inverzne zobrazenie je x = h-1(y) = A-1y. lahko sa vidí, ze Dh-i (y) = det A-1 = d t a a preto fY(y) = id^AÍfx(A-1y), y G Príklad 9.4. Nech X je spojita náhodná velicina s hustotou fX(x). Nájdite hustotu náhodnej veliciný Y = X2. Riesenie. Pouzijeme Vetu 9.5. Funkcia h : r — R daná predpisom y = h(x) = x2 je regularna a prosta na disjunktných otvorených mnozinach G1 = (—x, 0),G2 = (0, to), pricom tieto mnoziný zobrazuje na h(G1) = (0, to) a h(G2) = (0, to) a Jq=QlUQ2 f x (x)dx = 1. h-1 dane predpisom h-1(y) = —^fy je inverzne zobrazenie k zobrazeniu h : G1 = (—to, 0) — h(G1) a h-1(y) = ^fy je inverzne zobrazenie k zobrazeniu h : G2 = (0, to) — h(G2). Pre y G h(G\) je Dh-i (y) = — -2f— a pre y G h(G2) je Dh-i (y) = 2f—. Nahodná premennáa Y = h(X) máa preto hustotu f () f ()+ f () í 2^ (fX ( — fy)+ fX(fy)) , ak y G (0, X) fy(y) = f1(y) + f2(y) = < vu 0, inak. Poznámka. Casto potrebujeme spocítat hustotu nahodnej veliciný Y = h(X), kde X = (X1, ...,Xn)' a h je realna borelovský meratelna funkcia n premenných. Ak Fx je distribucná funkcia náhodneho vektora 40 X, tak distribucnú funkcia núhodnej veliciny Y je Fy(y) = P(Y 0 dana konstanta, tak núhodnú velicina Z = mú hustotu h(z) = 1 J f i (Zzpj f2(x)xdx, s.v. 42 Predchúdžajúce vety využijeme na odvodenie najdoležitejsích roždelení (okrem už spomenuteho normúlneho roždelenia), ktore budeme použúvat v statistike. Veta 9.8. Nech X1, ■■■,Xn sú nežavisle N(0,1) roždelene nahodne veliciny. Nahodna velicina Y = X22 + X2 + ■■■ + X2n ma x2 roždelenie s n stupňami volnosti (ožnacujeme Y ~ \^ s hustotou f(y) = 2n I1(n)y22—1e — y pre y> 0 a f(y) = 0 pre y < 0. Dôkaž: Vetu dokažeme indukciou. Pre n = 1 je pre x > 0 FX2 (x) = P {X22 0 a fu ( u) = 0 pre u < 0. 43 Dôkaz: Platí U = k . Výuzijeme Vetu 9.7(ii) a Vetu 9.8. Dostávame pre u > 0 (pre u < 0 je hustota xk rovna 0) k f0 1 (uyk \ k — i _uyk „ , , f00 1 ŕuyk\ 2 i _uyk 1 m_ y fU (u) = — / y—k-— - e 2m ——-—- y 2 ie 2 dy (*.) 2 _^_ f°°y^ — ie— i(f+Ddy W 2k+ŕr(f)r(m)Jo y y (substitucia 2 (Jm + 1) = t) 2m h k m 2 ui—mm + 1) i r° 2^t^i _tl W 2^r(2)r(m) J0 (ku + 1 2 2 m i , _ k + m )" 22 Veta 9.10. Nech X ~ Náhodna velicina y = y/X má x rozdelenie a n stupnami volnosti (znacíme Y ~ xn) a hustotu 1 y2 fY (y) = 2n — ip( n ) y^V pre y > 0 a fy (y) = 0 pre y < 0. Dokaz: Náhodna velicina Y nadobáda (rovnako ako X) len kladne hodnotý. Pre y > 0 je 2 ry Fy (y) = P {y/X E (X) = a; (iii) ak existujá E(X1), E(X2) => E(a1X1 + a2X2) = a1E(X1) + a2E(X2); (iv) ak existuju E(X1), E(X2) a X1 < X2 =^ E(X1) < E(X2); (v) ak \X1\ < X2 a existuje E(X2), tak existuje E(X1); (vi) nečh P (X > 0) = 1 a existuje E (X) => E (X) > 0. Dôkaz vyplyva z vlastností Lebesgueovho integralu. lDalsie vlastnosti strednej hodnoty, hlavne vzorče vhodne na jej vápočet vyplyvajá z vety o prenose integrácie z meratelneho priestoru (lí, A) na meratelný priestor (A, D) pomocou meratelnej funkcie g. Táto veta v prípade, ze (A, d) = (R™, Bn) a g je n—rozmerny náhodny vektor znie: Veta 10.2. (O prenose integráčie.) Nečh X = (X1, ...,Xn)' je nahodny vektor definovany na pravde-podobnostnom priestore (lí, A, P), g je borelovsky meratelná funkčia na (Rn, Bn), PX je rozdelenie pravdepodobnosti naáhodnáeho vektora X. Potom í g(X(w))dP(w) = f g(x)dPx(x) v zmysle, ze ak jeden z integrálov existuje, tak existuje aj druhá a rovnajá sa. Poznámka. Ak má náhodny vektor X = (X1,Xn)' distribučná funkčiu F(•), potom rozdelenie pravdepodobnosti Px = , kde ^p je Lebesgueova-Stieltjesova miera indukovaná distribučnou funkčiou F a mozeme písat f g(X(w))dP(w) = f g(x)dMp(x) pís==m^ g(x)dF(x). Jq Jr*1 Jr*1 Priamym dôsledkom vety o prenose integračie je nasledujáči dôsledok, pomočou ktoreho spočítame stredná hodnotu náhodnej veličiny Y = g(X), ked g je borelovska funkčia a X náhodná veličina. 45 Dôsledok. Nech X je nahodna velicina a g borelovská fúnkcia. Potom stredná hodnota nahodnej veliciny Y = g(X) existúje prave vtedy, ak existúje a je konecny integrál \g(x)\d,F(x) < x. V tomto prápade platá /c g(x)dF(x) c (teda Y = g(X) G Li(íl, A,P) & fc°oo \g(x)\d,F(x)dx < x). Špeciálne (a) ak je X diskretna s pravdepodobnostnoú fúnkcioú (xi,pi)ieJ, potom E (Y) existúje prave vtedy ak J2iej \g(xi)\Pi < x a platá E(Y) = £ g(xi)pi (teda Y = g(X) G Li(íl, A, P) & Y,ieJ \g(xi)\Pi < x). (b) ak je X spojita s hústotoú f, potom E (Y) existúje prave vtedy ak existúje \g(x)\f (x)dx < x a platá /c g(x)f(x)dx c (teda Y = g(X) G Li(íl, A,P) & f-^ \g(x)\f (x)dx < x). V prápade, dze v predchaádzajúácom Doôsledkú úvadzújeme fúnkciú g(x) = x, vieme spodcátadt strednúá hodnotú náahodnej velidciny X nasledovne: Dôsledok. Nech X je nahodna velicina na (íl, A, P). Potom stredna hodnota nahodnej veliciny X existúje práave vtedy, ak existúje a je konedcnyá integraál c \ x\ dF( x) < x. V tomto prápade platá /c xdF(x) -oo (teda X G A(lí, A,P) & J-c \x\dF (x)dx < x). Sdpeciáalne (a) ak je X diskretna s pravdepodobnostnoú fúnkcioú (xi,pi)ieJ, potom E (X) existúje práve vtedy ak J2ieJ \xi\Pi < x a platá E(X) = xipi (teda X G Li(lí, A,P) & £iej \xj\pj < x). (b) ak je X spojitaá s hústotoú f, potom E( X) existúje praáve vtedy ak existúje c \ x\ f( x)dx < x a platá /c xf(x)dx c (teda X G A (íl, A, P) & J-^ \x\f (x)dx < x). V prápade, dze máame náahodnyá vektor, tak poúdzijeme nasledújúáci dôosledok. Dôsledok. Nech X = (Xi,Xn)' je nahodny vektor definovany na (íl, A, P) a g(xi,xn) borelovská fúnkcia. Potom strednáa hodnota naáhodnej velidciny Y = g(X) existúje práave vtedy, ak existúje a je konedcnyá integrál /R„ \g(x)\dF(x) < x. V tomto prápade platá E(Y) = g(x)dF(x). Sdpeciáalne 46 (a) ak je X je diskrétneho týpu s pravdepodobnostnou funkciou (xi,pi)ieJ, potom E (Y) existuje prave vtedý ak £ieJ \g(xi)\pi < to a platá E (Y )= ]T g(xi)pi. ie J (b) ak je X spojita s hustotou f (x1,xn), potom E (Y) existuje prave vtedý ak existuje f \g(x)\f (x)dx < to a platá E (Y) = f g(x)f (x)dx. Príklad 10.1. Stredná hodnota nahodnej veliciný s poissonovským rozdelenám (stredna hodnota Pois-sonovho rozdelenia). Nech X ~ Po(A), teda X ma pravdepodobnostná funkciu (xi,pi)i>1, kde xi = 0,1, 2,... -x Axí a pi = r x—-. i Preto E(X) = Vjr-x ^ = r-XY^ TA— = Ar-x V 7A— = Ar-x V ^ = A. Príklad 10.2. Stredná hodnota náhodnej veliciný s normálným rozdelenám. Nech X ~ N (/j,, a2), a > 0, 1 (x-/J.)2 teda jej hustota je f (x) = _ r 2^2 ,x G (—to, to). Potom V2na r° 1 r0 (*-i->)2 E (X) = / xf (x)dx = _ / xr 2 0, (ii) D(X )= E (X2) — E2(X), (iii) ak P (X = a) = 1, tak D (X) = 0, (iv) D(a1 + a2X) = a2D(X), (v) ak X1 a X2 su nezavisle, tak D(X1 ± X2) = D(X1) + D(X2). (i) Pre núhodnu veličinu Y = (X — E (X ))2 platí, ze P (Y > 0) = 1, preto z vlastnosti strednej hodnoty E (Y) = D(X) > 0, (ii) D(X) = E (X — E (X ))2 = E [X2 — 2XE (X) + (E (X ))2] = = E (X2) — 2E (X )E (X) + (E (X ))2 = E (X2) — E 2(X), (iii) ak je P (X = a) = 1, tak X je diskretna núhodnú veličina s pravdepodobnostnou funkčiou (a, 1), teda E (X) = a1 = a a D(X) = E (X — E (X ))2 = (a — a)2 • 1=0, (iv) D(a1 + a2X) = E [a1 + a2X — E (a1 + a2X )]2 = E (a1 + a2X — a1 — a2E (X ))2 = E [a2(X — E (X ))2] = a2 E (X — E (X ))2 = a2D(X), (v) D(X1 ±X2) = E[X1 ±X2 —E(X1 ±X2)]2 = E[X1 ±X2 —E(X1)tE(X2)]2 = E[(X1 —E(X1))2±2(X1 — E (X1))(X2 —E (X2)) + (X2 —E (X2))2] = E (X1 —E (X1))2 + E (X2 —E (X2))2 ± 2E [(X1 —E (X1))(X2 —E (X2))]. Pretože sú X1 a X2 nezavisle, platú E(X1X2) = E(X1)E(X2). Ale tiez (X1 — E(X1)) a (X2 — E(X2)) sú nezavisle a tiez E[(X1 — E(X1))(X2 — E(X2))] = E(X1 — E(X1))E(X2 — E(X2)) = 0. Dostavame, ze D(X1 ± X2)= D(X1) + D(X2). * Príklad 10.3. Rozptyl nahodnej veličiny s poissonovskym rozdelením (rozptyl Poissonovho rozdelenia). Nečh X ~ Po(A), teda X ma pravdepodobnostnú funkčiu (xi,pi)i> 1, kde xj = 0,1, 2,... a pj = e-^^. V Prúklade 10.1. sme spočútali, ze E (X) = A. Platú D(X) = E (X2) — E2(X). Spočútame D(X ) = e (X —e (X ))2 = m. číslo a x = \J d (X) nazyvame smerodajnou odchýlkou nahodnej veličiny X. Poznámka. Ak X g l2, potom X g l1, lebo zo Sčhwarzovej nerovnosti \e(X)| = I / xdFX(x)l = I / 1xdFX(x) < \J R IU R 1—, r~. Dôkaz: 48 = e-XY ^ + e-AV A = e-AA2V ^ + A = A2 + A. Preto D(X) = E(X2) — E2(X) = A2 + A - A2 = A. Príklad 10.4. Rozptyl náhodnej veličiny s normálnym rozdelením. Nech X ~ W(/x, a2), a > 0, teda jej hustota je f (x) = _ e 2^2 , x G (—oo, to). V Príklade 10.2. sme spočítali, Ze E (X) = \i. Preto (x — //)2f (x)dx = —(x — jj)2e-JÍ22Ž- dx = (substitácia u = ——Ĺ, x = au + du = í-) a 2O = _ / u2e 2 du = 2 _ / u2e 2 du = (substitácia ^2- = t, u = a/2í, udu = dt) 2 r» 2 />00 r» 2 />00 3 2a2 /"^ r- tl 2a2 f00 3 < 2a2 ,„N 2a2 1 , 1n 2 Medián, modus a kvantily K charakterizacii rozdelenia pravdepodobnosti nahodnej veličiny X s distribučnou funkciou F sa pouZívajá aj ine charakteristiky. Jednou z nich je medián x. Je to (lubovolne) císlo, pre ktore platí F (x) < 1, F (x + 0) > 1. Vo v seobecnosti tieto podmienky neur cujuá mediaán jednozna cne. Dalsia charakteristika je modus x. Ak je náhodna velicina diskretneho typu s pravdepodobnostnou funkciou (xj ,pi)i>í, tak x je to císlo xj, pre ktore platí P (X = x) > P (X = xj), i = 1, 2,.... Ak ma X spojite rozdelenie s hustotou f, za mádus povazujeme tá hodnotu x G R, pre ktorá platí f (x) > f (x), —oo < x < oo. Ani máodus nie je vo v seobecnosti ur cenyá jednozna cne. Zavedme si funkciu F-1 predpisom F-1(u) = inf {x G R : F (x) > u}, 0 0 platí P(|X —E(X)|> e) 0 polozme Me = {w : IX (w) — E (X )| > e}. P {w : IX (w) —E (X )I > e} = f dP (w) = f 1dP (w) < f (X (w) E(X ))2 dp (w) < Jme Jme Jme e 49 e Jsi e teda P(|X -E(X)\> e) < . * Poznámka. Z Cebysevovej nerovnosti dostávame P (\X - E (X )\ < e) = 1 - P (\X - E (X )\ > e) > 1 - . V prípade, že zvolíme e = k\JD(X), je P(\X -E(X)\ < k^V(X)) > 1 Špeciálne pre k = 3 P (\X - E (X )\ < 3V/D(X)) > 1 - 1 = 0.89. 9 Kovariancia a korelaCná koeficient V nasledujácom budeme predpokladat, že nahodne veliCiny majá koneCne druhe momenty. Definícia 10.3. Kovariancia nahodnych velicín X a Y je (císlo) C (X, Y ) = E [(X -E (X ))(Y -E (Y))] a korelačný koeficient R(X,Y )= C (X,Y) VD(X )D(Y)' ak D(X) > 0, D(Y) > 0. Niekedy znaclme R(X, Y) ako . Pomocou vety o strednej hodnote transformovaneho náhodneho vektora dostavame Veta 10.6. Ak náhodne veliciny X a Y majá združená distribucná funkciu F (x,y), potom / (x -E(X))(y -E(Y))dF(x,y), -oo ./ —oo teda (a) v prípade, že (X, Y)' je náhodný vektor s pravdepodobnostnou funkciou ((xm,ym),pm)meJ, tak C (X, Y ) = ]T (x™ - E (X ))(ym - E (Y ))Pm; (b) v prípade, že (X, Y)' je spojitá náhodny vektor so združenou hustotou f (x,y), tak /z (x -E(X))(y -E(Y))f(x,y)dxdy. -co Veta 10.7. (Vlastnosti kovariancie a korelacneho koeficienta.) Nech X a Y sá náhodne veliciny, s konecnámi nenulovymi rožptylmi, a\,a2,b\,b2 G R. Potom (i) C (X, X) = V(X) a R(X, X) = 1; (ii) C (X, Y) = C(Y,X) a R(X,Y) = R(Y,X); (iii) C (X, Y )= E (XY) -E (X )E (Y); (iv) ak sá X a Y nežavisle nahodne veliciny, tak C (X, Y) = R(X, Y) = 0; 50 (v) \C(X,Y)\ 0 také, že P (Y = a + bX) = 1 a R(X, Y) = —1 <-==> existujú konstanty a a b < 0 také, že P (Y = a + bX) = 1. Dokaž: (i) C(X X) = 5(X — £(X))2 = D(X) a R(X, X) = JX^) = 1; (ii) C (X, Y) = £ [(X — £ (X ))(Y — £ (Y))] = £ [(Y — £ (Y ))(X — £ (X))] = C (Y, X), teda aj R(X, Y) = C(X,Y)= = C(Y X^ = r(y, x); (iii) C (X, Y) = £ [(X — £ (X ))(Y — £ (Y))] = £ [XY — X £ (Y) — Y£ (X) + £ (X )£ (Y)] = £(XY) — £(X)£(Y); (iv) ak su X a Y nežavisle, tak £ (XY) = £ (X )£ (Y) a teda C (X, Y) = £ (XY) —£ (X )£ (Y) = £ (X )£ (Y) — £ (X )£ (Y) = 0 a preto aj R(X,Y) = 0; (v) podla Schwaržovej nerovnosti /OO /"OO "I 2 / (x — £ (X —£ (Y ))dF (x,y) < -OO J —OO /oo poo n r poo poo / (x — £(X))2dF(x,y) / / (y — £(Y))2dF(x, y) , o —o —o —o teda \C(X,Y)\ < V/D(X)D(Y) a podelením tejto rovnosti vyražom V/D(X)D(Y) dostavame \R(X,Y)\ \C (X,Y )\ <1; VD(X)D(Y) < ; (vi) C (ai + a2X,bi + b2Y) = £ [(ai + — £ (ai + ))(bi + — £ (bi + ))] = £{[a2(X £ (X ))][b2(Y — £ (Y))]} = a2b2£ [(X — £ (X ))(Y — £ (Y))] = a2b2C (X, Y) a ak a2 = 0, b2 = 0, tak R(ai + a2X, bi + b2Y) = a^1b^C(X;^= = a2b2 R(xy )=sign(a2b2)R(X,Y); \a2\\b2\ (vii) D(X ± Y) = £ [X ± Y — £ (X ± Y )]2 = £ [(X — £ (X)) ± (Y — £ (Y ))]2 = £ [(X — £ (X ))2 ± 2(X — £ (X ))(Y — £ (Y)) + (Y — £ (Y ))2] = D(X) ± 2C (X, Y) + £ (Y); (viii) R(X,Y) = 1 \C(X,Y )\ = \J d (X )D(Y) > 0, t.j. nastala rovnost v Schwaržovej nerovnosti (10.1), ktorú može nastat prúve vtedy ked 1. 3b = 0, že hf {(x, y) G R2 : y — £ (Y) = b(x — £ (X))} = 1, alebo kecl 2. jjif {(x, y) g R2 : x — £ (X) =0} = 1 alebo jjif {(x, y) g R2 : y — £ (Y) =0} = 1. Pretože v druhom prípade by bola D(X) = 0 alebo D(Y) = 0 (Co nemôže byt), nastava iba 1. prípad a teda 3b = 0 P {u : Y (w) —£ (Y ) = b(X (w) —£ (X))} = 1, dcidže 3b = 0 P {Y = £ (Y) — b£ (X) + b(X) = a + bX } = 1. 51 Preto C (X, Y) = C (X, a + bX) = bC (X, X) > 0 (podla (vi)) a b> 0. Prípad R(X,Y) = —1 dokážeme úplne analogicky. £ Poznámka. Ak je C (X, Y) = 0, teda ak je R(X, Y) = 0, potom povieme, že nahodne veliCiny X a Y su nekorelované. Príklad 10.5. Nech (X, Y) je diskrétny nahodny vektor s pravdepodobnostnou funkciou ((x, y)i,pi)iej, priCom M = {(x, y)i]iej = { — 1,0,1} x { — 1,0,1} a p( — 1,1) = p( — 1, —1) = p(1,1) = p(1, —1) = 6, p(0,0) = 1, p( —1,0) = p(0,1) = p(0, —1) = p(1,0) = 0. VypoCítajte R(X,Y) a rozhodnite, Ci X a Y su nežavisie. x \ y —1 0 1 p x (x) —1 1/6 0 1/6 2/6 0 0 1/3 0 1/3 1 1/6 0 1/6 2/6 pY (y) 2/6 1/3 2/6 1 Riesenie: E (X) = E xe{-i,o,i} xpX (x) = ( —1)1 +0 3 + 11 = 0 a rovnako f (Y) = 0. Ďalej E (XY) = = E(x,„)e{-i,o,i}x{-i,o,i} xy px,y (x, y) = ( ——1)1 + 1( —1)1 + ( — 1)11 + 1 • 16 =0, teda C (X, Y) = E (XY )—E (X )E (Y) = 0. Nahodne veliCiny X a Y su nekorelovane. Ale pXY ( — 1, — 1) = 1 = pX ( —1)pY ( —1) = 2 2 = 1 6 6 9 . 11. CharakteristiCkú funkCia Pravdepodobnostne sprúvanie sa nahodnyCh veliCín a vektorov uplne Charakterizuje iCh rozdelenie pravdepodobnosti resp. distribuCnú funkda. Mnoho vlastností nahodnyCh veliCín alebo vektorov je ale tažkopande a ždlhave dokazovat pomoCou distribuCnej funktie. PraCujeme preto s inúm analytiCkym vyjadrením rozdelenia pravdepodobnosti, a sÍCe s Fourierovou-Stieltjesovou transformaCiou, ktora sa v teúrii pravdepodobnosti vola charakteristická funkcia. Definícia 11.1 CharakteristiCka funkda nahodnej veliCiny X je komplexna funkCia realnej premennej V>(-) : R C definovanú ako ý(t) = E (eitX) , t G R. V teorii pravdepodobnosti sa dokažuje množstvo vlastností CharakteristiCkúCh funkCiú. Niektoré sú obsahom nasledujuCej vety. Ďokažy tejto aj nasledujúdCh viet nújdeme v napr. knihe Renyi, A., Teorie pravdepodobnosti, ACAĎEMIA, Praha, 1972. Veta 11.1. NeCh X je nahodna veliCina a ý(t) jej CharakteristiCka funkCia. Potom (i) |V>(t)| < 1 Vt G R; (ii) ý(0) = 1; (iii) Vt g R ý(t) = ý(— t); (iv) ý(t) je rovnomerne spojitú na R. (V e> 0 3 g> 0 V t^ t^ . ^ - hl < g lý (t 2) — V>(ti)| < e) Veta 11.2. Ak existuje prvúCh n momentov yi!n núhodnej veliCiny X a tieto momenty sú koneCne, potom CharakteristiCka funkCia ý(t) núhodnej veliCiny X ma prvyCh n derivaCiú a platú ý(k)(0) = ik ^, k =1, 2,...,n. 52 Dd alej platá n (it)* ^(t)=z j* iikf+°(tn), *=0 k! kde o(tn) je taká fúmkcia, ze limt—0 o(tn ) = 0. Veta 11.3. Ak je //(t) charakteristicka fúnkcia zodpovedajúca distribúcnej fúmkcii F (x) a a,6, a <6 body spojitosti fúnkcie F(x), tak platá 1 c e-ita e-itb eita eitb F (6) - F (a)=2n L r(t) —t— /(-t) dt. Veta 11.4. Ak pre charakteristická fúnkciú ///(t) nahodnej premennej X platá \//(t)\dt < x, tak má X spojitúá hústotú f( x) a môodzeme jú vyjadridt v tvare f (x) = — J /(t)e-itxdt. Príklad 11.1. Nech X — A(ô), teda X má alternatívne rozdelenie s pravdepodobnostnoú fúnkcioú (xi,pi)i=i2, pricom xi = 0, x2 = 1 a pi = 1 - ô, p2 = ô. Charakteristická fúnkcia tejto nahodnej premennej je //x(t) = E(eitX) = eitx1 (1 - ô) + eitx2ô = eit0(1 - ô) + eitiô =1 - ô + eitô. Charakteristicka fúnkcia Y — Bi(n, ô) je /(t) = (1 - ô + eitô)n. Príklad 11.2. Nech X — Ro(-a,a) (rovnomerne rozdelena na (-a, a)). Potom jej hústota je —, ak — a < x < a 0, ak x G (-a, a). Charakteristická fúnkcia tejto nahodnej veliciny je pre t = 0 1 [ ■ -" /co pa eitxf (x)dx = eitxf (x)dx c -a 2a it 1 eita - e-ita cos(ta) + i sin(ta) - cos(-ta) + i sin(ta) sinat 2a it 2at at /c ei0xf(x)dx = 1. c Príklad 11.3. Nech U — N(0,1). Jej charakteristicka fúnkcia je / 0 je /X (t) = ei^te- . (Poúzite súbstitúciú - = u.) a 53 Dokúaňžme si eňste niektorúe vlastnosti charakteristickej funkcie. Veta 11.4. Nech X je nahodna velicina, ýX (t) jej charakteristicka funkcia, a, b reúlne cúsla. Potom núhodna velicina Y = a + bX ma charakteristickú funkciu ýY(t) = eitaý(tb). Dôokaž: ýy(t) = E (eitY) = E [eit(a+bX>) = E (eitaeitbX) = eitaE (eitbX) = eitaýx(tb). * Najdôoleňžitejňsie aplikúacie pre charakteristickuú funkciu plynuú ž nasledujuúcej vety. Veta 11.5. Nech X1 a X2 sú nežavisle nahodne veliciny s charakteristickúmi funkciami ^1(t) a ý2(t). Potom núhodna velicina X = X1 + X2 ma charakteristickú funkciu ýX(t) = ý1(t)ý2(t). Dôokaž: ý x (t) = E (>(Xl+X2)) = E (eitXi eitX2) = E (eitXi) E (eitX2) = ^í{t)^2{t). * Upožornujeme len, že tvrdenie Vety 11.5 podla nasledujuceho protiprúkladu nemožno obrútit. Príklad 11.4. Nech X1 ma Cauchyho roždelenie s hustotou f (x) = ^j+x?, x G R. Položme X2 = X1 a spocútajme charakteristickú funkciu núhodnej veliciny X = X1 + X2 = 2X1. Charakteristicka funkcia núahodnej veliňciny X1 je 1 o itx 1 t ýxi (t) = ~ eltx——2 dx = e m n J—o 1 + x2 (podňla režúduovej vety, moôňže sa pouňžiňt aj Dodatok na str. 98). Pretoňže X = 2X1 , je ýx (t) = ý0+2Xi (t) = eit0ýxi (2t) = e —2tl. Dostali sme ýXi+Xi (t) = ýXi (t)ýx2 (t), ale X1 a X2 nie sú nežúvisle. Charakteristickaú funkcia naúhodnúeho vektora Nech X = (X1, Xn)' je n—rožmernú núhodnú vektor. Definícia 11.2. Funkciu ý : Rn — C definovanú predpisom ý(t) = ý(t1, -,tn) = E (eit'X) = E (ei j tjX) budeme nažyvat charakteristickou funkciou náhodného vektora X. Analogicky ako v jednorožmernom prúpade sa dajuú odvodiňt vlastnosti charakteristickej funkcie núahodnúeho vektora. Veta 11.6. Platú (i) |ý(t)| < 1 pre vsetky t G Rn; (ii) ý(0,0,..., 0) = ý(0) = 1; (iii) ý(—t1, —t2, —tn) = ý(t1, ■■■,tn); (iv) ý je rovnomerne spojitúa na Rn; (v) b G Rm, Amn je matica reúlnych cisel, Y = b + AX, potom ýY(u) = eiu býx(A'u), u G Rm; (vi) kecl existujú stredne hodnoty E (Xj) pre j = 1, 2, n, potom = iE (Xj); t=(0,0,...,0) 54 (vii) ked existujá stredne hodnoty e(XjXk) pre j, k = 1, 2,n, potom dt dt = —e(X3Xk); VutjUbk J t=(0,0,...,0) (viii) ak (t) je charakteristická funkcia nahodnej veliciny X j, potom (t j) = ^x(0,0, ...,tj, 0,0); (ix) nech X má charakteristicku funkciu ^x(t1 ,...,tn) a Y ma charakteristická funkciu ^Y(t1,...,tn), pricom X, Y su nezávisle, potom Z = X + Y ma charakteristická funkciu V'z(t) a platí V'z(t) = V'x(t)^Y(t); (x) zlozky náhodneho vektora X = (X1, X2,Xn)' sá nezávisle prave vtedy ak V'x(t) = 11 í=1 "^Xí(ti) (dôkaz pozri v Renyi, A. Teoria pravdepodobnosti, ACADEMIA, Praha, 1972). 12. Konvergencia náhodnách velicín Majme postupnost náhodnych velicín X1,X2,... a náhodmi velicinu X. Nech sá vsetky tieto veliciny definovane na (tom istom) pravdepodobnostnom priestore (lí, a, P). Definícia 12.1. Povieme, ze Xn konverguje k X skoro iste, ak P({w : Xn(w) — X(w)}) = 1. Ak pre kazde e > 0 platí P({w : |Xn(w) — X>e}) — 0, potom povieme, ze Xn konverguje k X podlá pravdepodobnosti. Nech e (Xn) < oo pre n =1, 2,... . Ak platí e ((Xn — X)2) — 0, potom povieme, ze Xn konverguje k X podla (kvadratického) stredu. Nech Xn má distribucnu funkciu Fn(•) a nech Nech X ma distribucná funkciu F(•). Povieme, ze Xn konverguje k X v distribUcii ak Fn(x) konverguje k F (x) v kazdom bode x, v ktorom je F (•) spojita. Táto konvergencia sa casto oznacuje aj ako l(Xn) — l(X) a hovorí sa, ze Xn má asymptoticke rozdelenie l(X). Niekedy sa táto konvergencia vola aj slaba konvergencia. Lema 12.1. (i) Postupnost Xn konverguje k X podla pravdepodobnosti práve vtedy, ak //e > 0 a //ô > 0 existuje n0, ze pre v setky n > n0 platáí P({w : |Xn(w) — X(w^ >e}) < ô. (ii) Postupnost Xn konverguje k X podla pravdepodobnosti práve vtedy, ak //k g N a //ô > 0 existuje n0, ze pre v setky n > n0 platáí P({w : |Xn(w) — X(w)^ 1}) <ô. (iii) Postupnos t Xn konverguje k X pod la pravdepodobnosti práave vtedy, ak / e > 0 P({w : |Xn(w) — X(w)^ e}) — 0. Dôokaz je jednoduchyá a spravte si ho ako cvi cenie. Veta 12.1. (Limitná veta pre charakteristicke funkcie.) Nech je dana postupnost distribucnách funkcií Fi.(-), F2(^),... a im zodpovedajáca postupnost charakteristickych funkcií ^1(^),^2(^),... . K tomu, aby postupnost {Fn()} konvergovala k nejakej distibucnej funkcii F (•) vo vsetkách bodoch spojitosti tejto funkcie, 55 je nutné a stačí, aby postupnost {^n(-)} konvergovala v každom bode k nejakej funkcii V'(-), ktorá je spojitá v bode t = 0. Ak je tato podmienka splnena, tak ^(-) je charakteristická funkcia odpovedajúca distribučnej funkcii F(•) a postupnost {^n(-)} konverguje k ^(-) rovnomerne na každom konecnom intervale. (V V e> 0 3 N V n>N V t e \^(t) — >Ht)\ < e) Dokaž vety najdete napríklad v knihe Renyi, A. Teorie pravdepodobnosti, ACADEMIA, Praha, 1972. Veta 12.2. a) Z konvergencie skoro iste plynie konvergencia podla pravdepodobnosti. b) Z konvergencie podla stredu plynie konvergencia podla pravdepodobnosti. c) Z konvergencie podla pravdepodobnosti plynie konvergencia v distribúcii. Dokaž: požri Andel, J., Matematicka statistika, SNTL, Praha, 1985. Poznámka. Bež dalsích podmienok sa tvrdenie Vety 12.2 neda žosilnit. Z konvergencie skoro iste neplynie konvergencia podla stredu a ž konvergencie podla stredu neplynie konvergencia skoro iste. Z konvergencie poddla pravdepodobnosti neplynie konvergencia skoro iste ani konvergencia poddla stredu. Z konvergencie v distribucii neplynie konvergencia podla pravdepodobnosti ani konvergencia skoro iste ani konvergencia podla stredu. Protipríklady nájdeme v knižkach o teorii pravdepodobnosti. 13. Zakon velkých císel Ak mame postupnost nahodnych velicín X1,X2,ktore su nežávisle a rovnako roždelene, potom "vyberovú priemer", teda nahodní velicina n ^n=i Xi "sa blížži" (teda jej realižacia vždy "lepsie a lepsie" vyjadruje) strední hodnotu E(X\) (len upožordujeme, že stredne hodnoty nahodních velicín X1,X2sí rovnake). Tento fakt matematicky vyjadruje zákon velkých čísel. Jeho snad najjednoduchsia podoba je: Veta 13.1. (Zakon velkych císel.) Nech X1,X2,... su (po dvoch) nežavisle nahodne veliciny s rovnakymi strednymi hodnotami /i (konecnymi) a rovnakymi (konecnymi) rožptylmi a2 definovane na (rovnakom) pravdepodobnostnom priestore (íl, A, P). Potom pre n — x platí — 1 n x = - V) Xi — n n i=1 poddla pravdepodobnosti. Dokaž: Lahko sa vidí, že platí 2 E (X) = D(X) = —. n Z Cebysevovej nerovnosti (Veta 10.5) dostívame pre V e > 0 2 P(\X - n\> e) < ^, ne2 a2 pricom samožrejme pre n — x platí —2 — 0, takže P(\X — /i\ > e) — 0. f ne2 Ina modifikacia tohto žíkona, ktora sa casto používa v statistike je Veta 13.2. (Chincinova) Nech X1,X2,... su nežavisle nahodne veliciny rovnako roždelene s konecnou strednou hodnotou /i a definovane na (rovnakom) pravdepodobnostnom priestore (íl, A, P). Potom pre n — x platí — 1 n X =1Y/ Xi — / n i=1 56 poddla pravdepodobnosti. Dôkaž najdeme napríklad v knižke Andel, J., Matematicka statistika, SNTL, Praha, 1985. Niektore dôsledky uvedenúch žakonov velkúch Císel sú napr. Dôsledok. Nech Xi,X2,... sú (po dvoch) nežavisle nahodne veliciny s rovnakými strednúmi hodnotami j (konecnymi) a s rožptylmi D (Xi) < c,i = 1, 2,.... Potom {Xn}oo=i splna žakon velkych císel. Dôsledok (Markovova veta). Nech Xi,X2,... su (po dvoch) nežavisle nahodne veliciny s rovnakymi strednúmi hodnotami — (konecnymi) a s rožptylmi D(Xi), pricom lim„^O 4rD(£ľ=i Xi) = 0. Potom {Xn}°=i splda žúkon velkych císel. Dôsledok (Bernoulliho veta). Majme postupnost nežavislúch pokusov, pricom každy može koncit úspechom s pravdepodobnostou ô alebo neúspechom s pravdepodobnostou 1 — ô, (ô G (0,1)). Ožnacme núahodnuú velidcinu Yn — pocet úspechov v n nežavislúch pokusoch. Zn = — Yn je relatívna pocetnost úspechov v n pokusoch. Platú, že n Zn = ~ Yn — ô n poddla pravdepodobnosti. Dôokaž: Ak ožnadcúíme núahodnuú velidcinu Xi 0, ak v i—tom pokuse bol neuúspech 1 , ak v i—tom pokuse bol uúspech. Xi,X2,... sú nežúvisle, P(Xi = 0) = 1 — ô, P(Xi = 1) = ô, £(Xi) = ô, D(Xi) = ô(1 — ô) < 1. Platí Yn = En=i Xi a Zn = 1 Yn = — Vn=1 Xi. Podla Dosledku pred Markovou vetou Zn — ô podla pravdepodobnosti. 1 i n n 1 i Vyssieuvedene tvary žúkona velkúch císel žarucovali konvergenciu (vyberoveho priemeru) Xn k strednej hodnote j podla pravdepodobnosti. Preto sa volaju slabé zákony velkých čísel. Dajú sa odvodit vety, ktore žarucujú takuto konvergenciu skoro iste. Volajú sa silné zékony vekych čísel. Poznámka. K tomu, aby postupnost núhodnúch velicún Xi,X2,... spldala silny žakon velkych cúsel, stací, aby tato postupnost spldala podmienky Chincinovej vety. Toto tvrdenie sa vola II. Kolmogorova veta a jej dokaž je napr. v knižke Dupac, V., Huskova, M., Pravdepodobnost a matematicka statistika, KAROLINUM, Praha, 2001. Tam nújdeme aj ine formulúcie silneho žakona velkych císel. 14. Centrálne limitne vety Majme postupnost nežavislych nahodnych velicún Xi, X2,ktore su definovane na tom istom pravdepodob-nostnom priestore (íl, A, P). Ak £(Xi) = ji a D(Xi) = a2, tak núhodne veliciny Ci = Xi — ji nažyvame centrovane (majú nulovú strednu hodnotu); Ui = —i—— nažyvame standardižovane (majú nulovú strednú hodnotu a jednotkovú rožptyl). ai CCo je standardižovanú priemer nežavislych nahodnych velicín Xi,X2,... ? n n n n £ (Xn) = £ (-J2 —i) = "E —i, D(—n)= D( -J2 Xi) = a.', n z—^ n z—' n z—^ n2 —^ i = i i = i i = i i = i 57 preto standardizovany priemer nezavislúčh nahodnúčh veličín X1 ,X2,... je tt = X n — E (X n) = n e n=1 Xj — n U x = = e (X n) = n e j=1 Xj — n e j= m = e tAXj — y*) d (X n) x/n1, e n=1 a2 vTÍU a2 * n2 Ak E(X2) = m a D(X2) = a2, tak Ux = En=1|Xjf— M) = En=1(XXn — M) = ^(X1 + ... + Xn — um). na2 a n a n Centrúlne limitne vety tvrdia, ze za dost vseobečnyčh podmienok mú standardizovanú priemer nezavislyčh núhodnyčh veličín asymptotičky normovane normalne rozdelenie. Teda konverguje v distribúčii k nahodnej veličine s N(0,1) rozdelením. Veta 14.1. (Lindebergova CLV.) Nečh X1,X2,... sú nezavisle núhodne veličiny s rovnakým rozdelením pravdepodobnosti so strednou hodnotou m a konečnym nenulovym rozptylom a2. Potom Ux = ——=X + ... + Xn — um) konverguje k distribučii k nahodnej veličine X ~ N(0,1). Dokaz: Polozme Yj = x~i~tl, i = 1, 2,.... Nahodne veličiny Y^Y2sú nezavisle a standardizovane, teda E(Yj) = m1 = 0. Ičh rozptyl je 1. Je to aj ičh počiatočny moment druheho rúdu, teda ^2- Nečh čharakterističkú funkčia ičh rozdelenia je — (•). Podla Vety 11.2 je ; (it)° , (it)1 , (it)2 , 2s _ t2 . 2. m = mo-^t + m1ítt + m2^^t + °(t2) = 1 — 2 + °(t2), kde o(t2) je (nejaka) funkčia R(t), pričom limt_>.o = 0. Y Čharakterističkú funkčia —j (t) núhodnej veličiny —U je E (e *) =E V * -) = — (in,.) = 1 — 2U + R (—) Y1 Yn Pretoze Ux = —= + ... H--—=, je čharakteristička funkčia — n(t) nahodnej veličiny Ux rovnú x n n x —n(t)=[1 — 2U + R{vn)_ , pričom pre kazde pevne t je lim nR (-—U) = lim t2 = t2 lim Ríj4 = 0. n^řoo \\/n J n^řoo L_ J— ^ t ^ jn Pre kazde pevne t dostavame lim —n (t) = lim nn 1 — t — nR{ jn) n e 2 , čo je čharakteristička funkčia nahodnej veličiny s N(0,1) rozdelením. Podla Vety 12.1 múme vetu dokúzamL * 58 Veta 14.2 (Ljapunovova CLV.) Nech X1,X2, ■■■ su nežavisle nahodne veliciny pre ktore existujú konecne momenty E(Xk) = jik, V(Xk) = ak > 0, EIXk — *k I3 = Hf, k =1, 2, „.. Položme Sn = \JYl=\ °\, Kn = _ K \f^2n=1 Hf. Potom Ljapunovova podmienka limn^o —n = 0 je postacujúca k tomu, aby pre každe x G R k =1 k Sn lim P (UX < x) = lim P \^i=1 ^"J^T1 * < x\ = —= ľ e— £ dt. Dokaž najdeme napr. v knihe Renyi, A., Teorie pravdepodobnosti, ACADEMIA, Praha, 1972. Poznámka. Existuje vela modifikacií CLV. Mnohe najdeme v knihe Renyi, A., Teorie pravdepodobnosti, ACADEMIA, Praha, 1972. Veta 14.3 (Moivreova-Laplaceova integrúlna veta.) Nech p G (0,1) a Z1,Z2, ■■■ sú núhodne veliciny s binomickym roždelením, teda Zn — Bi(n,p). Potom platí pre každe x G R lim p( Zn — np <\ = 1 jX e— 2 dt. n^o° \ \]np(1 — p) j \/2n J—o Dôkaž: Veta je specialnym prúpadom Vety 14.1 (Lindebergova CLV) ak Xi, i = 1, 2, sú nežúvisle, Xi — A(p) (A(p) je alternatívne roždelenie s parametrom p). Potom E(Xi) = * a D(Xi) = p(1 — p) = a2. n 1 Zn — np Platí Y)n=1 Xi = Zn — Bi(n,p) a Ux = —p= (X1 + ■■■ + Xn — n*) = — n = konverguje v distribucii j=1 X2 a n np(1 — p) k naúhodnej veliňcine s N(0, 1) roždelenúím. * Poznaímka. Veta sa dúa sformulovaňt aj nasledovne: Pre p G (0,1), —oo < a < b < co nech Z1, Z2, ■■■ sú núhodne veliciny s binomickúm roždelením, teda Zn — Bi(n,p). Potom platí lim P (a < Zn — np -. < b | = $(b) — $(a), n^°° y ynp(1 — p) j kde $(•) je distribucna funkcia normovaneho normúlneho roždelenia. Prííklad 14.1. Núajdite pribliňžnuú hodnotu pravdepodobnosti toho, ňže poňcet ňsestiek, ktorúe padnuú v 12000 hodoch homogúennou kockou bude medži 1900 a 2150. Riesenie: tažko by sme spoďtali YŽ^wm (12<0°0)( 1 )i( | )12000—i ■ Pretože n = 12000, Zn - Bi(12000,1), E (Zn) np = i2§00 = 2000, D(Zn) = np(1 — p) = 20001 = 10f°, dostavame P(1900 < Zn < 2150) = P(1900 — E(Zn) < Zn — E(Zn) < 2150 — E(Zn)) = = P í 1900 — E(Zn) < Zn —E(Zn) < 2150 — E(ZnA = i 1900 — 2000 Zn — np 2150 — 2000 10000 \Jnp(1 — p) ^J~10000 ry P(—2.45 < " — np , < 3.67) = $(3.67) — $(—2.45) np(1 — p) 0.9998 - 0.0071 = 0.9927 (lebo $(—u) = 1 — $(u), kde $(•) je distribucna funkcia N(0,1) roždelenia). 59 15. Popisna statistika (podla Zvara, K., Sítepan, J. Pravdepodobnost a matematicka statistika, Matfyzpress, Praha, 2001) Statistika skáma javy na rozsiahlom sábore prípadov a zaújímajá jú tie vlastnosti javov, ktore sa prejavújú vo velkom súbore prípadov, nie v jednotlivách prípadoch. Zakladny pojem je statisticky sábor (základny sábor). Je to dobre definovaná (úrcena) mnozina statistickych jednotiek. Štatistická súbor môze byt úrceny zoznamom svojich prvkov (jednotiek), alebo pomocoú nejakáeho pravidla, predpisú. V práípade pochybnostáí sa daá overidt, dci skúámanaá jednotka patráí do dstatistickáeho súáború alebo nie. Na dstatistickyách jednotkáach sa meria (úrcúje, pozorúje) jeden alebo viac statistickách znakov. Znaky podla typov delíme na Nominálne znaky, ktorych hodnoty sá disjúngtne kategorie. Medzi hodnotami nie je ziaden vztah, úspo-riadanie. Napráíklad farba odcáí, politickaá práíslúdsnosdt, atdd. Ordinálne znaky sá vlastne nominalne znaky, ale ich hodnoty sa dajá úsporiadat. Napríklad najvyssie dosiahnútáe vzdelanie, hodnosdt ú vojska, podcet hviezdidciek v hotelovej kategoárii, atdd. Poznaáme len poradie hodnoty znakú, neexistúje "vzdialenost" medzi hodnotami. Intervalove znaky nadobádajá cáselne hodnoty. Sú teda úsporiadane, ale pozname ú nich aj (prirodzená) vzdialenosdt medzi hodnotami. Súá charakteristickáe táym, dze núla je ú nich len dohodnútáa (napr. teplotnáe stúpnice). Pomerove znaky, ktorych hodnoty sa vztahújá na nejaká dohodnútá jednotkú. Hodnoty znakú údavajú nasobok dohodnútej jednotky. Núla znamena neexistenciú meranej vlastnosti. Sem patrí napr. vacsina fyzikáalnych velidcáín. Sítatisticke znaky nominálne, ci ordinalne sa nazyvajá kvalitatívne, intervalove ci pomerove znaky sa nazávajú kvantitatívne (niekedy kardinálne). Kvantitatávne znaky deláme na diskretne a spojite. Predpokladajme, ze sme na n statistickych jednotkach namerali sábor hodnot xi,x2, ...,xn daneho znakú. Celkovemú poctú prvkov sáború hovoríme rozsah sáború. Ako spracovavame, zhrnieme, oznamújeme hodnoty súború ? Ak jednotliváe hodnoty (ordinaálneho resp. kvantitatáívnho) znakú úsporiadame do neklesajúácej postúpnosti x(i) < x(2) < ... < x(n), dostaneme úsporiadany sábor hodnôt. Indexy v dolnych zátvorkách údávajá poradie jednotlivych zistenych hodnôt znakú. Najmensia je x(i), najvacsia je x(n). Kecl je súbor velky a hodnoty sa casto opakújá, prehladnejsie ich zapíseme do tabúlky pocetností, v ktorej ai < a2 < ... < am sá navzajom rozne úsporiadane hodnoty znakú v súbore (v prípade nominalneho znakú len rozne hodnoty) a ni, n2,nm súá zistenáe (absolúátne) podcetnosti tyáchto hodnoôt (t.j. ni-kraát bola nameranaá v súábore hodnota znakú ai). Zrejme VJm=i ni = n. Takymto spôsobom sa typicky spracovavajá kvalitatívne znaky a diskretne znaky. V prápade kvantitatávneho spojitáeho znakú postúpújeme nasledovne. Kedd meranáy znak nadobúáda prálids vedla roôznych dcáselnyách hodnôot, úmelo zmendsáme podcet rozlidsovanyách hodnôot tak, dze obor vdsetkáych hodnôot rozdeláme na disjúnktne intervaly. Zvoláme napr. hranicne body (-x <)t0 (niekedy je vhodnejdsie < tj-i , tj)) stotodznáme so stredom tohto intervalú a,j = j j . Ak je t0 = -x, spravidla zvoláme ai = ti--2-—^, takze ti je v strede intervalú (ai,a2). Podobne pre tm = x spravidla voláme am = tm-i + m i -—m-2. Najcastejsie sa volia ti,t2, ...,tm-i tak, aby intervaly boli rovnako dlhe (az na krajne). Teda t j - tj-i = h, j = 2, 3,m - 1. 60 Teraz úrcáme pocty n j hodnot xi, ktore patria do jednotlivych intervalov (tried), tzv. triedne pocetnosti. Potom napáseme tabúlkú pocetnostá. Tabúlkú pocetnostá znázorníme graficky pomocoú polygonú pocetnostá, kecl lomenoú ciaroú spojáme body o sáradniciach (aj ,nj), j = 1, 2,...,m. castejsie znázornáme tabúlkú hh pocetnostá histogramom, kecl nad intervalmi (aj - 2,aj + 2 >, j = 1, 2, ...,m kresláme obdlznik, ktoreho váydska je rovnaá nj. Ak triedne intervaly nemajúá rovnakúá dsárkú, je nj vyádska obdáldznika nad zodpovedajúácim intervalom. Do úvedenych grafov sa da namiesto absolátnej pocetnostá nj znázornit aj relatávna pocetnost nj j f j = —, prápadne sa dajá absolútne resp. relatávne pocetnosti scátat (kúmúlovat) a poúzit búd £ i=i ni alebo ij=i fi (kúmúlatávne diagramy). Príklad 15.1. V tabúdlke 15.1 súá úvedenáe triedne podcetnosti priemernyách znáamok na koncorodcnom vysvedcená ú 372 detá. Zodpovedajúce histogramy (triednych pocetnostá a kúmúlatávnych triednych pocetnostá) sú (obr. 10.1 v Zvára, K., Sítepan, J. Pravdepodobnost a matematicka statistika) Histogram triednych pocetností Histogram kúmúlatávnych triednych pocetnostá 61 interval < tj-1,tj) stred aj poCetnost n j kumul. poCetnost N j < 1,0;1,2) 1,1 31 31 < 1,2;1,4) 1,3 48 79 < 1,4;1,6) 1,5 29 108 < 1,6;1,8) 1,7 37 145 < 1,8; 2,0) 1,9 27 172 < 2, 0; 2, 2) 2,1 41 213 < 2, 2; 2, 4) 2,3 32 245 < 2, 4; 2, 6) 2,5 19 264 < 2, 6; 2, 8) 2,7 28 292 < 2, 8; 3, 0) 2,9 23 315 < 3, 0; 3, 2) 3,1 24 339 < 3, 2; 3, 4) 3,3 25 364 < 3, 4; 3, 6) 3,5 4 368 < 3, 6; 3, 8) 3,7 4 372 Tabulka 15.1 Poznámka. ObyCajne použúvame triedne intervaly konstantnej súrky. Pri volbe poCtu intervalov môžeme vyjst žo Sturgesovho pravidla, podla ktorého m = 1 + 3, 3log10 n = 1 + 1, 43 ln n. Tejto hodnoty sa pridržiavame "približne". Miery polohy Miery polohy udúavajuú hodnotu, okolo ktorej sa naChúadžajuú jednotlivúe požorovania (hodnoty žnaku). Priemer (tiež vúberovy, Ci empiriCkú aritmetiCky priemer) 1 n 1 m Priemer sa urCuje u kvantitatívnyCh žnakoCh a rovnakým spôsobom žavisí od každej hodnoty žnaku. Zrejme pre lubovolne a, b je _ 1 n a + bx (= — y (a + bxi)) = a + bx, n i=1 tak že sa prirodžene menúí so žmenou merúítka. GeometriCkú priemer xG = ^ x1x2...xn. GeometriCkyú priemer maú žmysel len ked v setky hodnoty žnaku suú kladnúe. Nie je invariantnyú vo Ci lineúarnej transformúaCii uúdajov. Pou žúíva sa v prúípade, že ide o naúsobenie. Castej sie sa pou žúíva v ekonúomii. Napr. ak je inflaCia 20%, 50%, 30%, 20% a 5% (v jednotlivyCh rokoCh), tak je to to iste, ako keby bola inflúCia každú 62 rok 24%, lebo výsledná inflácia je 1, 2.1, 5.1, 3.1, 2.1,05 = 2, 9484 a to je to isté ako keby v každom roku bola %1, 2.1, 5.1, 3.1, 2.1,05 = 1, 24. Harmonický priemer _ 1 n xH = -j y = y . ~ 2—*i=i 2-^i=i Tiež nie je invariantný voCi lineárnej transformácii. Da sa ukažat, že ak sú vSetky hodnoty žnaku kladne, tak platí x h < Xg < x (požri napr. Andel, J., Statisticke metody, Matfýžpress, Praha, 1993). Median (rožumie sa vúberový medián) je definovaný pomocou usporiadaneho súboru hodnot x(1) < x (2) < ... < x (n) ako Íx(n+i), ak n je nepárne (liche) 2 í x( r2) + x( „ + ak n je parne (sude). Je to taka hodnota, ktora delí usporiadane hodnotý x(1),x(2), ...,x(n) na dva rovnako pocetne dielý. Preto nežaleží, ake velke (male) sú prve resp. posledne clený usporiadaneho súboru x(1),x(2), ...,x(n). Platí (a + bx) = a + bX. Ak g() je monotúnna funkcia, potom analogická vlastnost platí pre transformovane hodnotý. Ak je pocet hodnot nepárný (lichý), platí tato vlastnost presne, ak je pocet hodnot párný (sudý), platí "skoro presne" (g(x) nie je vo vseobecnosti v tomto prípade priemerom hodnot g(x(2)),g(x(n+2)). Pre nepárný (lichý) pocet meraní ma median žmýsel už pri ordinálnom žnaku, pri parnom (sudom) pocte meraní potrebujeme kvantitatívný žnak. Kebý sme pre párný (sudú) pocet meraní definovali median ako lubovolne císlo, pre ktore platí x(2) < x < x(2 nebol bý síce definovaný jednožnacne, ale existoval bý aj pre ordinalný žnak (s císelnými hodnotami). Median možene žovseobecnit. Namiesto toho, abý oddeloval polovicu najmensích udajov od ostatnúch, môže oddelovat p—tý diel údajov. Zvoláme p, 0 < p < 1. Definujeme p—tý výberový kvantil (percentil) vžtahom {x([np] + 1), ak np =[np] 2 (x(np) + x(nP+i)) ak np = [np], kde [np] je celá cast np, t.j. najvacsie cele cáslo nie vacsie ako np. Napr. pre p = 0,12, n = 24 je [np] = [2, 88] = 2, teda x0y12 = x(3) a pre p = 0, 4, n = 50 je [np] = [20] = 20, teda x0j4 = ^ (x(20) + x(21)). U ordinalneho žnaku (cáselneho) ak np = [np], môžeme ako xp použit lubovolnú hodnotu, ktorá ležá medži x([np]) a x([np]+1). Medián je speciálný prípad výberoveho kvantilu, a síce x = x0i5. V grafickúch žobraženiach sa používaju dolný kvartil a horný kvartil Q1 = xo,25, Q3 = xo,75. Modus je najcastejsou hodnotou. Má žmýsel najma vtedý, ak je pocet m skutocne sa výskýtujúcich rožných hodnot podstatne mensí ako rožsah n súboru. Mádus je použitelná pre každý týp žnaku (aj ked v 63 prípade nominalneho znaku je tazko hovorit o miere polohý). Nemusí být urcený jednoznacne (bimodalne suáborý). Mierý variabilitý Mierý variabilitý charakterizujá velkost variabilitý hodnot znaku okolo nejakej "mierý jej polohý", alebo "roztrásenost" hodnôt znaku. Miera variabilitý bý mala být invariantna voci "posunutiu" vsetkých hodnot znaku, resp. voci linearnej transformacii hodnot znaku. Rozptýl (empirická rozptýl) 1n S2x = xn i=1 i=1 resp. ak a1 < a2 < ... < am sá rozne hodnotý znaku, tak 1 m S2x =" x n j=1 j=1 ^""^ n j (aj — x)2. Platáí 1 n 1 n 1 n 1 n 1 n x n n i n i n n i=1 i=1 i=1 i=1 i=1 1 I -sr^ 2 -2 " ■ nx ŕ' i= Niekedý sa pou záíva n J2(xi—x)2 sx = 1 n1 i= (neskôor budeme analýzova t pre co). Ked sa pouzívajá triedne pocetnosti, doporucuje sa Sheppardova korekcia, co znamená zmensit výraz 1 m _ h2 sx = — Xjľ=1 nj(aj — x)2 o hodnotu —, kde h je sírka rovnako sirokách triedných intervalov. x n j=1 12 Smerodajná odchálka (empiricka smerodajna odchýlka) sx sx Jej doôle zitaá vlastnos t je, ze je výjadrenáa v rovnakáých jednotkáach ako nameranáe uádaje. Rozptýl aj smerodajnáa odchálka zalezia na vsetkách ádajoch (sá citlive na hodnotý najma "krajnách" ádajov). Rozpatie je rozdiel maximálnej a minimalnej hodnotý R = x(n) — x(1). Rozpatie zalezí len na velkosti maximálnej a minimalnej hodnotý. Kvartilove rozpatie Rq = Q3 — Q1 = xo,75 — xo,25 Kvartilova odchýlka je polovica kvartiloveho rozpatia Q3 — Q1 _ xo,75 — xg,25 n 64 Priemernú odChylka je 1 n d = — y lxi — xi n i=1 (niekedy sa namiesto mediúnu x použ ije priemer x). Vsetky uvedene miery variability predpokladajú kvantitatívny žnak. Pre žnaky nominúlne (aj ordinalne) sa variabilita da Charakterižovat pomoCou entropie m nj nj nn j=1 pri Com predpokladaúme m rôožnyCh hodnoôt žnaku s nenulovúymi po Cetnos tami n1, n2 , , nm. Miery šikmosti a špicatosti Výberový koeficient šikmosti (skewness) ns3 ktory môže byt kladnú aj žaporny (Kladnú (pravú) sikmost je ak hustota je konCentrovana v " l avej" C asti grafu a "pomaly dlho graf klesú). Kvantilovú koefitient sikmosti x1-p xp x1-p xp pre 0 < p < 0, 5. spedalne pre p = 0, 25 to je kvartilovy koefident s ikmosti (Q3 — x) — (x — Q1) Q3 — Q1 ' Výberový koeficient spicatosti (excess) ns4 J2j=i (xi x)4 o 92 = -;--3 a kvantilový koeficient spicatosti x(n) - x(1) x1—p xp pre 0 < p < 0, 5. Diagramy Velmi nazorne a oblýbene sý vedl a histogramov aj ine graficke znazornenia nameraných ýdajov a ich vlastností. Zaradujeme ich medzi exploracne (výskumne) statisticke metýdy (EDA - Exploratory Data Analysis). Krabicový (fuzatý) diagram (box plot, box and whisker plot). Ma mnohe modifikýcie, napr. (obr. 10.2, Zvara, K., s t epan, J. Pravde podobnost a matematicka statistika) Na krabicovom diagrame sý Q1,Q3,x, Rq, tykadlýa (fuýzy) siahajuý k takýemu najvzdialenej siemu (od odpovedajuýceho kvartila) pozorovaniu, ktorýe nie je od neho vzdialene viac ako 1,5 nasobok kvartiloveho rozpatia. Jednotlivo sU znazornovane pozorovania, ktoré 65 sú viaC vždialene. U niektorúCh programov siahaju "fúžy" k najmensiemu resp. k najväCsiemu požorovaniu. Inokedy k vyúberovúemu 10% resp. 90% kvantilu. Príklad 15.2. (JednoduChy prípad.) Namerali sa udaje 21,24,24,25,25,25,25,25, 26,26,27,27, teda n = 12. lahko vidíme, že x = 25, Q1 = x0j25 = 2 [x(3) + x(4)] = 1 (24 + 25) = 24, 5, Q3 = x0 75 = 2 [x(9) + x(10)] = 26. Rq = Q3 — Q1 = 26 — 24, 5 = 1, 5. Najmensie požorovanie je odlahle, lebo 21 < 24, 5 — 1, 5.1, 5 = 22, 25. KrabiCovy diagram je uvedeny vyssie. Príklad 15.3. Zistovali sa hmotnosti detí v 12. mesiaCi idi veku. Histogramy poCetností dievCat a ChlapCov sú (obr. 10.3, Zvúra, K., Stepan, J. Pravdepodobnost a matematiCka statistika) 66 Oba histogramy ukažují na kladní sikmost. Vidiet, že hmotnosti chalpcov sí v priemere vacsie ako dievcat. Odpovedajúce krabicove diagramy sí (obr. 10.4, Zvíra, K., Stepan, J. Pravdepodobnost a mate-matickía statistika) Ked chceme vyjadri t žaívislos t (suívislos t) dvoch kvantitatíívnych žnakov s nameraníymi hodnotami (x1,y1),(xn,yn), použijeme rožptyloví diagram, na ktorom sí žnažornene body [xi,yi]. Tri rôžne typy žaívislostíí suí na nasledujuícich obraížkoch (obr. 10.5, Zvaíra, K., St epían, J. Pravd epodobnost a matematickía statistika) 67 Ak sledujeme sácasne správanie sa niekolkých znakov, uzitocná sa ukazuje maticový diagram, v ktorom sá znazornene sucasne histogramý pre jednotlive znaký a (vzájomne) rozptýlove diagramý (obr. 10.6, Zvara, K., Stepan, J. Pravdepodobnost a matematicka statistika) 68 16. Náhodný výber Štatistike sa niekedy hovorí, že je metodologická náuka, ktorá objektivizuje proces poznania. Skúsme si popísat, ako sa to dosahuje. Základný súbor (statistický súbor) voláme tiež popúlacia. Predpokladame, že má N jednotiek (N ^> 0). Principialne môžeme žmerat hodnotu kvantitatívneho žnakú Z na každej jednotke a dostat hodnoty z1,z2,zN. Priemer hodnot ž celej popúlacie ožnaCme / a búdeme ho nažývat popúlaCný priemer. OžnaCme a2 popúlacný rožptýl, teda 1 N 1 N i=1 i=1 Pretože N je velmi velke, nie je možne (resp. je velmi nehospodarne) žmerat hodnotú žnakú na každej jednotke. Preto výberieme skúpinú n jednotiek a žistíme hodnotú žnakú len na týchto jednotkach. Tento výber (výberový súbor) músí být taký, abýdobre reprežentoval celú popúlaciú (celýžakladnýsúbor). Búdeme vždý predpokladat, že n < N. Jeden žo spôsobov dosiahnút "dobre reprežentújúci" vúberový súbor je úrobit núhodný výber bež vrútenia (prostý nahodný vúber). To žnamenú, že výberieme jeden ž N prvkov žakladneho súború, potom nahodne výberieme jeden ž N — 1 žostavajúcich, atd., až jeden ž N — n +1 žostavajúcich. Vúberový súbor môžeme výbrat (n) spôsobmi. Ked búdeme prvký výberoveho súború výberat núhodne, tak dosiahneme požadovanú reprežentatúívnos t a ka ždúa n— tica búde ma t rovnakúú pravdepodobnos t, že búde výbranúa.. Mý sa sústredíme na tžv. výber s vratením ž konecnej popúlacie. Núhodne výberieme ž popúlacie nejakú prvok (nejakú statistickú jednotkú), žistíme hodnotú meraneho žnakú a vrútime ho spät. Ožnacme X — hodnotú žnakú na núhodne výbranej statistickej jednotke. Zrejme X je núhodnú velicina, ktora nadobúda hodnotý b1 < b2 < ... — X)2 n 1 i=1 i=1 i=1 1/n ľ n "In \ = ^ Ea2 +2e (m — X)]T(Xi — m) + e]T(X — /)2 = n 1 i=1 i=1 i=1 70 = -_na2 +--25 n(p - X)- ]T(X - li) +--fj^(X - M)2 = n — 1 n — 1 n n — 1 L i=i J i=i = _1_a2 - 2f (X - M)2 + E(X - u)2 = -Jí-a2 - __1D(X) = n - 1 n - 1 n - 1 n - 1 n - 1 n 2 n a2 2 = -t a2--- — = a2. * n - 1 n - 1 n Ak je základný súbor rozsiahly, niekedy ho rozdelíme na L "neprekrývajúcich" sa častí, ktoré nazývame oblasti. Z kazdej oblasti vykoname prostý náhodný vúber (bez vrátenia). Kazdú oblast povazujeme za "mensí" zakladný súbor. Oblastne usporiadanie výberú (oblastný výber) je motivovane napr. tým, ze celý zakladný súbor pozostáva z "prirodzených" podsúborov, ze zber dát v úrčitúch podoblastiach je specifická (finančne, casovo), atd. Oblasti môzú být aj "úmelo výtvorene". Ak sú rozsahý oblastí N1, N2,NL a oblastne výberove súborý majú rozsahý n1,n2,nL, potom celý základný súbor má rozsah N = N1 + ...+NL a celý výberový súbor ma rozsah n = n1 + ... + nL. Ak N1 = N2 = ... = NL l= Kh tak hovoríme, ze oblastný výber je rovnomernú. V takomto prípade má kazda jednotka rovnakú pravde- n podobnost n zahrnútia do vúberú (nezávisle od toho, do ktorej oblati patrí). Ak sa zakladný súbor sklada z velmi velkeho mnozstva jednotiek (roztrúsených), tazko úskútocnáme aj oblastný výber. Vzniká potreba výberat jednotký vzdý po celých skúpinach. Skúpiný mozeme povazovat za nove jednotký vzniknúte zlúcovanám povodných jednotiek. Môzú to být male skúpiný (napr. rodiný), alebo aj velmi velke (okresý, skolý, zavodý v podnikú). Tento sposob vúberú nazývame dvojstúpňovú výber. Najprv výberieme skúpinký, z ktorých potom výberame "prvotne" jednotký. Vúber skúpiniek nazývame prvúm výberovým stúpňom. Vúber prvotných jednotiek nazúvame drúhúm výberovým stúpňom. Nech oblasti obsahújú po rade M1, M2,ML skúpiniek, z ktorých v prvom výberovom stúpni výberieme postúpne m1, m2, ...,mL skúpiniek. V drúhom výberovom stúpni z kazdej výberovej skúpinký v h-tej oblasti (ak táto skúpinka bola v prvom stúpni výbraná) výberieme 100^^ percent prvotných jednotiek. Ako zvolit císla m1,mL,n1, ...,nL, abý kazda prvotná jednotka mala rovnakú pravdepodobnost dostat sa do vúberoveho súúború, bez ohňladú na to, do ktorej oblasti resp. skúpinký patrúí. Oznaňcme naúhodnúý javý A- statisticka jednotka J z h-tej oblasti bola výbrata do výberoveho súború v drúhom výberovom stúpni B- skúpina, do ktorej patrí statistická jednotka J, bola výbrata v h-tej oblasti v prvom výberovom stúpni Je zrejme, ze statistická jednotka J bola výbrata do výberoveho súború práve vtedý, ak nastal nahodný jav A n B. Platí P (A n B) = P (A\B)P (B). Zrejme P (B) = mmh a P (A|B) = nh. Preto pravdepodobnosti, ze Mh prvotnaú jednotka z h-tej oblasti (h = 1, 2, ... , L) sa dostane do vúýberovúeho súúború súú postúpne m1 m2 mL M n1,W2 n2,...,MTL nL. Výúber búde rovnomernýú, ak m m2 mL Mn1 = M2n2 = " = MnL. V tomto prúípade ka zdaú jednotka v zaúkladnom súúbore búde ma t rovnakúú pravdepodobnos t dosta t sa do vúýberovúeho súúború. 71 Príklad 16.1. Pri štatistickom šetrení týkajúcom sa zistovania sociálnych pomerov v rodinách školákov do 15 rokov prvý stupen zalezal od výberu skol a druhý od vúberu Žiakov vybranej skoly. skoly boli rozdelene na 3 druhy (oblasti), a síce, (i) pät rocne skoly, (ii) devat rocne skoly, (iii) osemroc ne gymnúzia. Z pät roc nych 771 i 1 skôl bola vybrata kazda stú skola, teda-= - a z tejto skoly boli zahrnute do vyberu vsetci ziaci, teda ^ 'Mi 100 J y y ' ni = 1. Z devät rocnych s kol bola vybrata kazda pät desiata a do vúberu z nej vybratú kazdy druhy ziak. Z osemroc nych gymnazií bolo vybrate kaz de dvadsiate piate a z neho vybratú kazdy stvrty z iak. Teda mi Mi 1 = 100' n i = 1 ' mini M1 1 = 100' m-2 M2 1 = 50' n2 = 1 2' m2^2 M2 1 = 100' m3 M3 1 = 25' n3 = 1 4' m3n3 M3 1 = 100' Kazdy ziak bez ohladu na druh skoly mal pravdepodobnost dostat sa do vyberu. V kazdom druhu vyberu majú vúberovy priemer, vyberovy rozptyl a ine vyberove charakteristiky specificke (pravdepodobnostne, statisticke) vlastnosti. O tom pojednava teoria vyberovych s etrení. 17. Odhady parametrov (hlavne podl a Andel, J., Matematicka statistika, SNTL/ALFA, Praha, 1985) Predpokladajme, ze núhodny vektor X = (Xi' X2'...' Xn)' ma hustotu (v prípade diskrétneho nahodneho vektora pravdepodobnostnú funkciu) f (x ' 6), kde 6 = (ôi' ô2 '... '0 m)' je neznúmy parameter. Na zaklade X je treba získat "co moz no najleps í" odhad tohto parametra. Vieme len tolko, ze 6 sa nachadza v parametrickom priestore Q (pozor, nie je to tentokrat priestor elementárnych javov). Definícia 17.1. Bodovú odhad parametra 6 = (0i' 02'... ' ôm)' je meratelne zobrazenie g : (R"' Bn) —> (Rm ' Bm) (nezavisiace od 6) take, ze m—rozmerny nahodny vektor t = g(X) v nejakom "rozumnom zmysle" aproximuje neznamy vektor parametrov 6). Poznámka. Obycajne predpokladúme, ze nahodny vektor X = (X^ X2'... ' Xn)' je núhodnym vyberom z rozdelenia s distribu cnou funkciou F(•; 6). Preto sa niekedy pre upresnenie povie, ze odhad T je zaloz eny na núahodnom vektore X. Definícia 17.2. Intervalovy odhad parametra 6 = (0^ 02'...'0m)' je takú (núhodnú) mnozina z Bm, ktorúa s "dostato cne ve lkou" pravdepodobnos tou pokrúyva 6. Poznámka. Namiesto parametra 6 môzeme uvazovat aj odhad urcitej (konkretnej) parametrickej funkcie h(6). Niekedy sa najprv vezmu nejake meratelne funkcie Si(x)'...'Sk(x), vytvorí sa nahodny vektor S(X) = (Si(X)' S2(X) ' ...'Sk (X))' (pre m < k < n). Kazdy takyto nahodny vektor sa vola statistika. Ak k = m, tak takúato statistika je (bodovyúm) odhadom. Definícia 17.3. Povieme, ze odhad T parametra 6 je nestrannú, ak platí VO G Q £e (T) = 6. 72 Poznámka. Odhad T (ako predpis) nezávisí od 6, ale jeho rozdelenie pravdepodobnosti od 6 zavisí. Preto sa v Definícii 17.3 píse eg(T). Zdôrazňuje sa tym, ze stredna hodnota odhadu T sa ráta za predpokladu, ze hodnota parametra rozdelenia je rovná 6. Niekedy nestrannyá odhad vôobec neexistuje, alebo existuje inyá odhad ako nestrannáy, ktoryá je z urňcitáeho hňladiska vyáhodnejňsá. Príklad 17.1. Majme nahodny váber X1, X2,Xn z rozdelenia s distribucnou funkciou F(•) a konecnou strednou hodnotou / a disperziou a2. Náahodnáa veliňcina — 1 n T(X1, ...,Xn) = X = — / Xi n i=1 je podla Vety 16.1 nestrannym odhadom parametra /i. Podla Vety 16.2 je s 2 = E (Xi—x )2 n1 i=1 nestrannyám odhadom a2. Inám kriteriom pre odhad T(X1,Xn) jednorozmerneho parametra ô je velkost jeho strednekvadratickej odchálky, teda e (T — Ô)2. Platá e (T — Ô)2 = e ((T — e (T)) + (E (T) — Ô))2 = = e [(T — e (T ))2] + 2E [(T — e (T ))(E (T) — ô)] + e [(E (T) — ô)2] = d (T) + (E (T) — ô)2, ňco je rozumnáa charakteristika odhadu. Ak platá e (T) = 6 + b(6), pricom (vektorová) funkcia b nie je identicky rovna 0 na mnozine í, tak odhad T je vychyleny. Vektoru b( 6) sa hovorá vychyálenie odhadu T v bode 6. Prííklad 17.2. Nech X je diskráetna náahodnáa veliňcina s binomickyám rozdelenám pravdepodobnosti, teda X ~ Bi(n,p), pricom n povazujeme za známe. Pre funkciu 2, a2 > 0. Pre vyberovy 1 — 2a4 rozptyl S2 =-- En=i(Xi — X )2 platí E (S2) = a2 (pozri Vetu 16.2) a D(S2) =-- (dokázeme si v n — 1 j 1 n — 1 kapitole 19). Majme odhad parametra a2 (ktory odhad je typu) T (X) = n=1(Xi — X )2. Pre ake c má tento odhad minimalnu strednekvadraticku odchylku ? Comu sa tato odchylka rovna ? Riesenie: T = (n — 1)cS2, preto E (T) = (n — 1) cE (S2) = (n — 1)ca2 a D(T) = (n — 1)2c2D(S2) = 2a4c2(n — 1). Strednekvadratickáa odcháylka odhadu T je E (T — a2)2 = D(T) + (E (T) — a2)2 = 2a4c2(n — 1) + [(n — 1)ca2 — a2]2 = = a4{2c2(n — 1) + (n — 1)2c2 — 2c(n — 1) + 1} = a4{c2(n2 — 1) — 2c(n — 1) + 1}. Vzhladom na c to je kvadratická funkcia, ktorá ma minimum (po derivacii) v bode c = —+—p Preto odhad T (X) = —-+y Eí=1 (Xi — X )2 má najmensiu strednekvadratická odchylku zo vsetkách odhadov typu T (X) = c E n=1(Xi — X )2. Táto minimalna strednekvadratická odchylka je 4 { n2 — 1 2(n — 1) } = 2a4 a \ (n + 1)2 n +1 + J n +1. Uvaňzujme teraz jednorozmernáy parameter ô. Nech X1 , X2, suá nezáavisláe rovnako rozdelenáe náahodnáe veliciny definovane na tom istom pravdepodobnostnom priestore (íl*, A, P) s rozdelením pravdepodobnosti, ktore má distribucná funkciu F(^,ô). Pre kazde prirodzene n majme Tn(X1,X2, ...,Xn) - odhad parametra ô. Definícia 17.4. Tn je konzistentnym odhadom ô, ak Tn konverguje podla pravdepodobnosti k ô, t.j. //e> 0 P{w G íl* : |Tn(w) — ô| > e} — 0. Veta 17.1 Nech pre kaňzdáe prirodzenáe n je E(Tn2) < o. Ak (i) E(Tn) — ô a (ii) D(Tn) — 0, tak Tn je konzistentnyám odhadom parametra ô. Dôokaz: Vyuňzijeme dve nerovnosti, a sáíce /Y > 0 P— E 1 — (Cebysevova nerovnost) a |a + b < a + m (nerovnost platna pre vsetky realne císla). Preto {w : |Tn(w) — ô| P {w : |Tn(w) —E (Tn^ < 2 n E (Tn) — ô| < |}. Platá, ze ak A, B sái dva náhodne javy a P (B) = 1 => P (A n B) = P (A) (lebo A U B D B 1 = P (B) < P (A U B) = 1 a 0 = P (A U B) — P (B) = P (A) — P (A n B). Pretoze E (Tn) — ô (s pravdepodobnostou 1), teda //e> 0 3mo Vn > mo P {w : E (Tn) — ô| < |} = 1, dostavame z (17.1) (17.2) /e> 0 3mo /n > mo P{w : |Tn(w) — ô| < e} > P{w : |Tn(w) —E(Tn^ 0 vů> 0 3n20 vn > n20 d(Tn) < ů e2 Z Cebýsevovej nerovnosti zase platí pre kazde n (17.4) ve > 0 P {u : \Tn(w) — e (Tn)\ < | }> 1 — . Zo vz tahov (17.3) a (17.4) dostáavame, ze (17.5) ve> 0 Vů > 0 3n20 ze Vn > n20 P {u : \Tn(u) —e (Tn)\ < 2 }> 1 — ů. Zo vztahov (17.2) a (17.5) dostavame, ze ve vů > 0 vn > max{n10,n20} P {u : \Tn(u) — 9\ P {u : \Tn(u) —e (Tn)\ < | }> 1 — ů. * Príklad 17.4. Nech X1 ,X2,... sá nezavisle nahodne veliciný, kazda s rovnomernám rozdelením pravdepodobnosti na intervale (0, 0), 0 > 0 (nezname). Náhodná velicina X(n) = max{X1,X2, ...,Xn}. Ukazme, ze X(n) je konzistentný odhad parametra 0. Pritom X(n) nie je nestranná odhad parametra 0. RieSsenie: Hustota rozdelenia pravdepodobnosti nahodnej veliciný Xi, i g {1, 2, ...,n} je fi(t) ak t < 0 ak t g (0, 0) ak t > 0. Preto distribuScnáa funkcia Fx(n) (x) = P{X(n) 0. 0, fx(n) (x)= FX (n) (x) ak x < 0 ak x g (0, 0) ak x > 0 Dostáavame, Sze E(X(n)) = ■J0 n1 nxn 1 n xx c&xx — 0n 0n 2 nxn 1 n x2^~dx = ^ xn+1 n + 1_ "xn+2 n + 2 n0 n + 1, n02 n I2 D(X(n))= e (X2n)) —e 2(X(n)) n02 n + 2 n202 = n02 (n + 1)2 = (n + 1)2(n + 2). 4 a 75 Podla Vety 17.1 je X(n) konžistentnym odhadom 0 (E(Tn) — 0 a D(Tn) — 0). Lahko v tomto prípade n+1 žískame nestranny konžistentny odhad. StaCí žvoli t Tn =-X(n). n Teraž si žavedieme eficientnú (vydatny) odhad. Majme jednorožmerný parameter 0 a nahodný vektor X = (X1,Xn)' nech ma hustotu f (x, 0) (distribuCnú funkCiu F (x, 0). Majme odhad T = T (X) parametra 0. Aka je dolna hraniCa strednej kvadratiCkej Chyby E (T — 0)2 ? Kedy sa tato hraniCa dosiahne ? Definícia 17.5. System hustot {f (x, 0), 0 G ll} je regularny, ak platí a) ll je nepraždna otvorena množina, b) mno žina M = {x : f(x, 0) > 0} nežaúvisúí od 0, d f (x, 0) c) pre V0 G í a pre skoro vs etky x G M existuje koneC na parciúlna derivacia f '(x, 0) = -—-—, d0 d) pre V0 G ll platí JM dF(x, 0) = 0, e) pre V0 G í je integral (vyraž) J(0) = J M f '(x,0)] dF (x, 0) kone Cny a kladny (0 < J (0) < to). ./ (M). Veličinu J (ô) voláme Fisherova informácia o parametri ô (Fisherova miera informácie o parametri ô, ktorá (informácia) je obsiahnutá v danej regulárnej triede hustot) . Fisherovu informúciu môž eme chúpat aj ako J (0)=E- [(m ľ]= E> [(ľ; f n lebo mimo množiny M môž eme definovat f lubovolne, teda aj ako 0 a ža integraC ny obor vžiat R™. Príklad 17.5. System hustot {f (x, 0) = -^== e- ( 2' ,—00 < x < oo,0 G í = R} (vžhladom k Lebesguovej miere) je regulaúrny (ide o hustoty N( 0, 1)). Ďokažte ako cviCenie. Veta 17.2. (Raova-Cramerova) Nech T je takú odhad 0, že V 0 G Q je Eg(T2) < to. Nech b(0) = Eg(T) —0 je vyChyúlenie (bias) odhadu T. NeCh platúí (i) system hustôt {f (x, 0), 0 G íl} je regularny, (ii) pre V0 G ll existuje derivúcia b'(0), (iii) V0 G ll dL M T (x)dF (x,0) = f m T (x) fg^ dF (x,0). Potom pre V0 G ll platí f (T 0)^ [1 + b'(0)]2 Eg(T — 0) ~ J(0) . Ďokaž: b(0) = Eg (T) — 0 = í T (x) dF (x, 0) — 0, M teda b(0) + 0 = í T(x)dF(x,0). M Pod la (iii) dL f T (x)dF (x,0)^ T (x) dF (x,0) = b'(0) + 1. 76 Z podmienky d) regularity triedy hustôt {f (x, ô), ô G íl] platí ' M teda / (T(x) - ')TiV^dF(x,') = b(Ô) + 1. ./M '(x,ô) Podla Schwarzovej nerovnosti r , r r -1(x ô)12 ' (Xô) 1 dF (x, ô), [b1 (ô) + 1]2 < f (T(x) - ô)2dF(x, ô) / M [1 + b1 (ô)}2 f (x, ô) 0 J(ô) J(ô) ( J( ô ) > 0 v regulaárnej triede hustôot). [1 + b (ô)}2 Dostavame, ze rovnost -——- = Eg (T — ô)2 nastava práve vtedy ak platá (P), Cize 3K (ô) nezávisla J(ô) na x, ze s.v. vzhladom k Lebesgueovej-Stieltjesovej miere [ip f ( x, ô) f (x, ô) Co je to iste ako K (ô)[T (x) — ô], dô alebo d ln f (x,ô)= K (ô)T (x) — K (ô)ô, (17.6) J d ln fd^,eô dô = T (x) J K (ô)dô — j K (ô)ôdô. Ak oznacáme J K (ô)dô = Q(ô) aj K (ô)ôdô = iž(ô) tak (17.6) mozeme napísat ako ln f (x, ô) = Q(ô)T (x) — R(ô) + H (x). Keď este oznaCáme C (ô) = e-R(g), u(x) = eH(x), tak dostavame pre hustotu f (x,ô) f (x, ô) = C (ô)eQ(g)T (x)u(x). Definícia 17.6. NeCh parametriCky priestor Q je totozná s nejakou borelovskou mnozinou v Rm. Ak hustota f (x, 9) náhodneho vektora X má tvar f (x, 9) = C(9)e^j=i Qj (9)Tj (x)u(x), 77 kde C(9), Qj(9) sú merateíné funkcie parametra 9 a Tj(x), w(x) sú merateíné funkcie premennej x, tak povieme, že f (x, 9) je hustota exponenciaíneho typu. [1 + b'(9)]2 Poznámka. V Raovej-Cramerovej vete nastúva rovnost-——-= eg(T — 0)2 prave vtedy ak hustota J (0) núhodneho vektora X je exponenciaíneho typu. Definícia 17.7. Ak pre odhad T parametra 0 píatí, že spĺňa vsetky predpokíady Raovej-Cramerovej vety, Čiže v 0 g Q je eg(T2) < oo a (i) system hustôt {f (x, 0), 0 g Q] je reguíúrny, (ii) pre v0 g Q existuje derivúcia b'(0), (iii) v0 g Q dL f m t (x)dF (x,0) = f m T (x) dF (x, 0) (b(0) = eg (T) — 0 je vychýíenie (bias) odhadu T), potom tento odhad nazývame reguíarny. Dôsledok. Pre každy reguíarny nestrannú odhad T parametra 0 píatí d (T) > 1 J (0)- císíu sa hovorí doínú Raova-Cramerova hranica pre disperziu reguíúrneho nestranneho odhadu. Definícia 17.8. Eficienciu (vydatnost) e reguíarneho nestranneho odhadu T definujeme ako = 1 Eficiencia sa dá písat aj ako Pretože platí, že D(T )J (9) J (e) d (T)' je d(T) > J(9) > 0 1 >D(Tyj(9) =e> 0 Čiže 0 1 (požri Cramer, H., Mathematical methods of statistics, Princeton, 1946, §32.3). Príklad 17.6. Nech X(,Xn je nahodná výber ž N(9,1). Odhad T = X = n Yľi=i X% je nestranný, regulárný a eficientná odhad parametra 9. Dokážte. Riesenie: T = X = ^n=( X,, pricom X( ,...,Xn sUnežavisle, teda e (T) = 9, d (T) = n, £ (T2) = 92+n. Združene roždelenie X = (X(, ...,Xn)' ma hustotu f (x, 9) = —^-n e-5^ rl=1ixi-e)2. Tento sýstem hustôt je „ (2n) 2 regulárný (dokážte). dalej f '(x, 9)= d-ífd9^ = f> - 9) f (x, 9), 1 e= 78 1 'O' = ÍÁ ""ff ^ = /n n n J2 'xi - O' f 'x, O'dx = E [J2'Xi - o']2 = J2i = n. -n Li=i J i=i i=i Este preverme podmienku 'iii' Raovej-Cramerovej vety. Platí :£ T 'x'dF 'x,O' = d E 'T 'X'' = — e = e = i aejRn y' y' ' eeKK" de /„ T 'x' dF 'x, O' = £ T 'x'f ''x, O'dx : 1 x >i ] > >i - O'f 'x, O'dx = E{X'n'X - O''} K1 gx^ Š< = n£[(X - 6 + 6){X - 6)} = n{V(X) + 6£(X - 6)} = n ji j = 1. Vidíme, že T = X je nestranný odhad 6, regulárny a jeho disperzia je —, Co je ——. Je preto aj eficientný. n J (6) a 18. Metoda maximálnej vierohodnosti a momentová metoda Popíšeme dve konkrétne cesty na odvodenie odhadu. Majme nahodny vektor X = 'X1,X2, ...,Xn'' a pozname jeho hustotu p'x,O' 'resp. v diskrétnom prípade pravdepodobnostnú funkciu 'xm,pm'O"meJ'. Predpokladajme, Ze O G ll, kde íl je otvorený interval v R. Pri pevnej hodnote O je hustota p'x, O' funkciou x. Pravda pre lubovolne 'pevne' x môZeme p'x, O' 'resp. P{X1 = x1, ...,Xn = xn; O}' chúpat ako funkciu parametra O. Pre túto funkciu budeme pouZívat oznacenie L'x, O' a volat ju vierohodnostna funkcia 'z anglickeho likelihood function'. Samozrejme môZeme uvaZovat aj funkciu nahodneho vektora L'X,O' 'ak napr. L'-, O' je pre dane O meratelna funkcia, tak L'X, O' je nahodna veliclna'. Definícia 18.1. Ak existuje O* G íl, Ze pre vsetky O G ll '18.1' L'X, O' < L'X, O*', potom hovoríme, Ze O* je odhad parametra O získaný metódou maximálnej vierohodnosti (ML odhad). Analyzujme predchadzajúcu definíciu. Pre dane x vieme 'casto aj explicitne' najst O*'x', ktoré maximalizuje L'x, O'. Teda takto mame urcenu 'niekedy aj explicitne' funkciu O*'x'. Ak ju chapeme ako funkciu níhodneho vektora O* 'X', tak toto je ML odhad parametra O. Jeho realizacia je O* 'x' 'ak realizacia nahodneho vektora X je x'. Zrejme ak L'x, O' 'pri kaZdom x' je dostatocne hladka funkcia O 'napr. pre dL' x, O' kaZde x existuje -—-—', potom O* nutne musí byt riesením rovnice dO dL'X, '18.2' V ' = 0. e=e* d6 Ak položíme ln0 = —to, potom L(X, 6) < L(X, 6*) bude platit pre vSetky 6 G íl práve vtedy ak //O G ll ln L'X, O' < ln L'X, O*'. 79 Teda v prípade dostatočne hladkej íunkcie L môžeme písat rovnicu (18.2) ako (18.3) d ln L(X,6) 39 3 lnp(X,9) 8=8* 39 3l(X,t 8=8* 39 =0 8=8* Rovnicu (18.3) volame vierohodnostna rovnica. Poznámka. Doležity pri úvahach okolo rovnice (18.3) je fakt, že Q je otvoreny interval. Keby k Q patril jej krajnú bod, mohlo by sa stat, že 9* splňujúci (18.3) je prave v tomto bode. Vtedy ale 9* nemusú byt koreňom (18.3). V clalsom sa ohraniďme na prípad, že X1, ■■■,Xn je nahodny vyber žo spojiteho roždelenia s hustotou f (•, 9) (v diskretnom prípade s pravdepodobnostnou funkciou (xm,pm)meJ). Potom X = (X1, ■■■,Xn)' mú hustotu p(x, 9) = f (x1, 9)...f (xn, 9). Vierohodnostnú rovnica (18.3) mú preto tvar (v diskrúetnom prúpade in=1 3 ln f( Xi, 9) i=1 3 ln (9) (18.4) £ 39 i=1 =0 8=8* 39 = 0). \8=8* Poznámka. Da sa dokúžat, že ža "rožumnych predpokladov" existuje riesenie n9* = 9*(X1, Xn) vierohodnostnej rovnice (18.4), (vlastne postupnost riesenú {n9*}n>1), ktore je maximalne vierohodnym odhadom. Tento odhad múa veňlmi vúyžnaňcnuú pravepodobnostnuú vlastnosňt, a súce je konžistentnyúm odhadom (teda podla pravdepodobnosti n9* — 90, kde 90 je skutocna hodnota parametra 9) (požri napr. Andel, J., Zúklady matematicke statistiky, MATFYZPRESS, Praha, 2005, §7.6). Navyse to je asymptoticky normalny vierohodny odhad, presnejsie -n(n9* — 90) — N i0, jk) J (90) (konvergencia v distribuúcii . Pre prakticke úcely to žnamenú, že pri "dostatocne velkom" n považujeme roždelenie pravdepodobnosti nahodnej veliciny n9* ža N (90, —. ). Pretože J(90) nepožname, "nahradžame" ho (blížkou) hodnotou nj(90) J (n9*). Príklad 18.1. Majme núhodny vúber X = (X1, Xn) ž binomickeho roždelenia s paramtrami m (žnamym) a n g (0,1). Parameter n odhadujeme metodou maximalnej vierohodnosti. Núhodna velicina Xi,i g {1, 2, .■■,n} mú pravdepodobnostnú funkciu (j,pj)j=0,1,...,m, kde pj = ("j)nj(1 — n)m—j. Vierohod-nostnaú rovnica (18.4) maú tvar " 3lnpX((n) = " 3ln [(Z)nXi(1 — n)m—Xi k 3n n=n* h 3n n 3 m M Z) + Xi ln n +(m — Xi)ln(1 — n) = i=1 L \ i / J 7T = 7T* = ■3- [nX ln n + n(m — X)ln(1 — n)]n=n* = —nX —-1— n(m — X) = 0 => n* = X n* 1 n* m 80 ak X = 0, X = m. lahko sa presvedCíme, že ide o maximum, lebo d^(X,0) = 1 nX 1 n(m X) = . = — n^nX — (i—n*yn(m — X) = 7r=7r* v / " X m — X 1 n*2 (1 — n*)2 V prípade, že mame vektor parametrov 9 G ll C Rm, tak namiesto jednej vierohodnostnej rovnice (18.4) ries ime sústavu vierohodnostnych rovníc (18.5) ± d ln f X 9) i 1 = 0, 3 = 1 2,...,m e=e* (v diskretnom prípade en=1 & (g) = 0, 3 = 1 , 2, ... , m). Aj v mnohorožmernom prúípade parametra majuú ML odhady analogiCkúe vlastnosti ako v jednorožmernom prúípade, bli ž sie požri napr. v knihe And el, J., Zúklady matematicke statistiky, MATFYZPRESS, Praha, 2005. Príklad 18.2. Majme núhodnú vyber X = (X1,Xn)' ž normúlneho roždelenia s parametrami u a a2, teda 9 = (u, a2)' a priestor parametrov ll = R x (0, to). Parametre odhadnime metúdou maximúlnej vierohodnosti. Hustota nahodnej veliCiny Xi, i G {1, 2,n} je a suústava vierohodnostnúyCh rovnúíC (18.5) je 1 n nln(2na2) — ±_ £(Xi — u)2 i=1 Teda da2 |2ln(2na2) 2a2. L i=1 -I H=fi* ,(ŕ) = t — 1 — ln t > 0. (Funkcia y>(ŕ) nadobúda pre kladné t minimum v bode t = 1, pričom ^(1) = 0.) Teraz si popíšeme relatívne najjednoduchšiu metodu získania odhadu - momentovú metodu. Nech X = (Xi,Xn)' je náhodnú vúber z rozdelenia, ktoré závisí od 9 = (ô1,6m)'. Nech pre všetky 9 G 12 existujú momenty Vk = E (Xk), k = 1, 2,...,m. Samozrejme tieto momenty tiez zavisia od 9, cize vk = vk (9). Vyberove momenty su 1 n i=1 Momentova metoda odhadu 9 spocíva v tom, ze (momentový) odhad 9 je riesením rovníc (18.9) vk (9) = Mk, k =1, 2,...,m. Niekedy sa môze stat, ze m rovníc (18.9) nestací k (jednoznacnemu) urceniu 0. Potom sa obycajne vezmu dalsie rovnice vk(9) = Mk, k = m + 1,... (samozrejme príslusne teoreticke momenty vk musia existovat). Podla Chincinovej vety (Veta 13.2.) Mk konverguju podla pravdepodobnosti k vk. Tento fakt spolu s inymi limitnymi vetami obydcajne umodznduje v konkr etnom pr ípade dokazadt konzistenciu odhadov z ískanych momentovou metodou. 1 _x Príklad 18.3. Majme nahodny vyber X1, X2,Xn z exponencialneho rozdelenia s f (x, 9) = -e o pre x > 0 a f (x, 9) = 0 pre x < 0. Platí v1(9) = 9, M1 = X, teda dostúavame odhad parametra 9 momentovou metúodou 9 = X. 82 19. Bodové a intervalové odhady parametrov normálneho rozdelenia Najprv si dokazme dve tvrdenia: Veta 19.1. Nech náhodná vektor X = (Xi, ...,Xn)' — N(fi, S), pričom S je pozitívne definitna matica (reguiarna). (Teda X má regulárne normálne rozdelenie.) Ak Bnn je reguiarna matica a a G Rn, tak nahodny vektor Y = a + BX — N (a + BX, BSB'). Dokaz: Použijeme Vetu 9.4 (o hustote transformovaneho náhodneho vektora). Hustota nahodneho vektora X je fx(x) = (2n)-n (det S)-2e-1 . Inverzne zobrazenie k h : h(x) = a+Bx je h-1(y) = B-1(y—a) a Jakobián -Dh-i (y) = det dhy' = det B-1. Preto hustota náhodneho vektora Y = a + BX je ÍY(y) = ÍX(B-1(y — a))| det B-1| = = (2n)-n (det S)-2 | det Bl-1e-1 (B-1 (y-a)-^'*-1(B-1(y-a)-^) = = (2n)-n (det(BSB'))-1 e-2 (y-a-B»Y (B*B' )-1(y-a-B^), čo je hustota N (a + B/lx, BSB). * Veta 19.2. Nech X1,...,Xn sá nezávisle, Xi — N(/ii,a2), i = 1, 2,...,n. B je ortonormálna n x n matica. Polozme X = (X1,Xn)' a Y = (Y1,Yn)' = B(X — //x), kde fi = /n)'. Potom Y1,Yn sá nezavisle a Yj — N(0,a2), j = 1, 2, ...,n. Dôkaz: Pretoze X1, ...,Xn sá nezavisle, Xi — N(/i,a2),i = 1, ...,n, ma X hustotu /x(x)=n 1 -e 2 ( ° ) (27rcr2)-n e- 1E n=1( i=1 co je hustota N(/lx,ct2I). Ak je B ortonormalna (teda BB' = B'B = I), tak z Vety 19.1 plynie, ze Y B(X — fi) — N(0, a2I) a preto ma Y hustotu ^ 1 „ /Y(y) = II -^e-mf =\{ (yi). * i=1 i=1 Teraz si dokazme nasledujácu vetu: Veta 19.3 Majme X1,Xn náhodná vyber z rozdelenia N (/x, a2). Pre výberová priemer X = "=1 Xi, a vyberovy rozptyl S2 = n=1(Xi — X )2 platí (i) X — N £ ); (ii) n-L s2 — x2n-1; _ (iii) ak je n > 1, tak su náhodne veliciny X a S2 nezávisle. Dokaz: Uvazujme ortonormalnu maticu B (Helmertova matica) B /b1 \ b'n- í 1 1 vT^2 _J_ /2~3 0 __2_ V(n-2)(n-1) V(n-2)(n-1) I _1_ _1_ \ V(n-1)n V(n-1)n 1 _=___n-2 V(n-2)(n-1) V(n-2)(n-1) V(n-1)n V("n-1)n/ 2 0 83 (presvedcte sa, že je ortonormaína). Podía Vety 19.2 je Y = (Yi, ...,Yn)' = B(X — fi) — N(0,a2I), (tentokrat fi = (j, ...,/)') a teda Yi — N(0,a2) i = 1, ...,n sú ždružene nežúvisíe. Poňcútajme (19.1) Y'Y = (X — f)'B' B(X — f) = (X — f )'(X — f) = ]T(Xi — j)2, i=1 1 n 1 _ 1 n n i=1 nn (19.3) £(X — X)2 = ]T[(X — j) — (X — j)]2 = i=1 i=1 nn = J2(Xi — J)2 — 2(X — j)J2(Xí — j) + n(X — j)2 = Y'Y — n(X — j)2 = i=1 i=1 nn = £Y2 — Y2 = £ Y/. i=1 i=2 Z (19.2) dostúvame X = ^ + J a podía Príkíadu 9.2 (aíebo Vety 19.1 pre n = 1) je X — N (j, n). Podía (19.3) je n—r-S2 = XJn=1(Xi — X)2 = XJn=2 (a je teda suctom mocnin nežavisíych núhodnych veíicín , pricom každú ž nich ma N(0,1) roždeíenie. Preto n—rS2 — yX2n-1- Pretože Y1, ...,Yn sú nežúvisíe sú aj X = ^ + j a S2 = —^-r Xn 9 Y2 nežúvisíe. £ K žostrojeniu bodovych a intervaíovúch odhadov parametrov normaíneho roždeíenia budeme okrem núhodnych veíicín (statistík) X a S2 potrebovat este statistiky tt X — J r rp X — J r U = --y/n a T = —-— y'n. a S Veta 19.4 Majme X1, ...,Xn nahodnú vúber ž roždeíenia N (j, a2). Nech X = n n=1 Xi je vyberovy priemer a S2 = n~1 Xn=1(Xi — X)2 vyberovy rožptyí. Píatí (i) u = X^vn — n (o, 1), (ii) T = XSS^\fň — tn—1 (Studentovo t roždeíenie s n — 1 stupnami voínosti). Dôkaž: Pretože podía Vety 19.3 X — N (j, n), podía Príkíadu 9.2 (aíebo Vety 19.1) mú U = ^ — N(0,1) roždeíenie. Podía predchúdžajúcej vety sú X a S2 nežúvisíe, preto aj U a n—21 S2 su nežavisíe, pricom n—21 S2 — xn-1. Nahodna veíicina _ T = /-= i-= ~^—Vn n— 1 n— n—1 n—1 ma Studentovo tn—1 roždeíenie. £ Veta 19.5 Majme X1,Xn núhodny vyber ž roždeíenia N (j, a2), kde j je nežnamy parameter (stredna hodnota) a a2 žnúame kíadnúe ňcúísío. Potom ' a (19.4) (x — U1—^-=,X + U1— 2 -=) \ 2 Vn 2 Vn/ je 100(1 — a)%—ny intervaí spoíahíivosti pre strednú hodnotu j pri žnúmom a2 (u1—a je (1 — 12) kvantií N(0, 1) roždeíenia (tabuňíkovanúa hodnota)). 84 Dôkaz: Pretože U = x-^vn — N(0,1), platí r X — u i— , 1 — a = P {u f < -a/™ < u--f } a = PiX — ui- f < u < X + ui-f --=\, { \l n 2 yjn J (lebo u a = — u--a). j!> Interval (19.4) je náhodný interval s pevnou dlžkou (jeho krajne hodnoty sú náhodne premenne). Chápat ho treba (frekventisticky) tak, že ak by sme realizovali napr. M—krat nezávisle nahodnú výber rozsahu n z N (u, a2) rozdelenia (pritom a2 pozname a u je vzdy rovnake), tak "priblizne" (1 — a) realizacií pokryje skutoCnU neznamu hodnotu u (teda 100(1 — a)% z tychto realizacií pokryje u). Veta 19.6 Majme X-, ...,Xn nahodny vyber z rozdelenia N (f, a2), kde u ani a2 nepoznanie. Potom (19.5) (X — tn--(1 — 2) -n,X + tn--(1 — 2) a S — . a. S v™, je 100(1 — a)%— ný interval spolahlivosti pre strednú hodnotu ^ pri neznámom a2 (t„_i(l — f) je (1 — f) kvantil Študentovho tn-1 rozdelenia) a (19 6) / 2n — 1)S2 (n— 1)S2 \ () \xl-1(1 — f)' xLi(f)/ je 100(1 — a)%—ny interval spolahlivosti pre rozptyl a2 (x^--^ — f) je (1 — f) kvantil Xn,-- rozdelenia). Dôkaz: Pretoze T = ^/n — tn--, platí 1 — a = P jtn--^) < S^^ň < tn--(1 — 2^ = = \X — tn--(1 — 2) 7ň < u < X +tn--(1 — 2) 7^}. Vzhladom na to, ze n-2-S2 — XX2n--, zase platí an 1 — a = P^--(2) < — S* <^-r,- 2. {xn--( f) < ňa21 S2 < xl--(1 — f)} p f (n — 1)S2 2< (n — 1)S2 1 ^xn--(1 — t) < < x2n--(tw. 2/ An-U2- V dalsom sa budeme zaoberat prípadom, ze máme dva nezavisle nahodne vúbery. Veta 19.7 Majme X-,Xnx nahodnú vyber z rozdelenia N (fX ,a2X), X je jeho vyberovú priemer a SX nY nahodnú vyber z rozdelenia N (fy, ay, jeho vyberovú rozptyl. clalej majme Y-, ...,YnY nahodny vyber z rozdelenia N(fiy,ay), Y je jeho vyberovy priemer a Sy jeho vyberovy rozptyl. Predpokladajme, ze oba vúbery su nezúvisle. Potom (i) dstatistika Ux-y = X — Y — — fY) — N (0,1), nx nY (ii) ak aX2 = ay2 = a2, tak dstatistika T__= X — Y — (fx — Uy ) / n x ny t ±X-y = l(nx--)SX + (nY--WV nX + ny — ^^^ V nx +nY-2 85 (iii) statistika f = f f = q2 „2 Fnx — 1,nY — 1. ix - Dokaz: Z nezavislosti nahodnúch vúberov výplýva, ze statistiký X, Y, SX, Sy sú nezavisle. (i) Pretoze X - N(px, nx), Y - N(py, ^) a sú nezávisle, je X - Y - N(px - py, nx + nY) (výplýva to napr. z Vetý 11.5 o charakteristickej fúnkcii súctú nezavislúch nahodnúch velicín). Potom ale ňstandardizovanúa núahodnúa veliňcina Ux-v = X - Y - (PX - PY) - N(0,1). (ii) Ak je aX2 = ay2 = a2, tak ňstatistika UX—Y X - Y - (px - py) = X - Y - (px - py) ~J2 _2 I i i ix. + lil a* — + V X - Y - (px - py )J _x ny - n (o, 1). a y _x + ny Pretoze nxCT——1 S\ — Xnx — 1, nYa—1 Sy — x1Y — 1 ma náhodná velicina nX - 1 SX + -n—-— sY = -2 [(nX - 1)SX + (_Y - 1)sY] - Xlx +nY — 2 a2 a2 a2 x Y (výplýva to napr. z definície x2 rozdelenia) a je nezavisla s . Potom ale X — Y — (nx —vy ) Ux-Y i V nx +nY IJZ [(nx — 1)S2x + (nY — 1)SY ] ! V nx +nY —2 V ~Ť7~ T7 / \ l- nx +nY —2 V nx +nY —2 X - Y - (px - py) / nx ny 'nx — 1)Sx + (nY — 1)SY V (iii) ňlahko vidúíme, ňze (nx — 1)S2x + (nY — 1)SY\j nx + ny nx +nY —2 nx — 1 S2 TX — Y — +nY —2. nY — 1o2 q2 _2 1 1nx — 1,nY— 1. * 1Y SY SY X ny - 1 Teraz úňz ňlahko dokúaňzeme nasledújúúcú vetú Veta 19.8 Majme X1,Xnx nahodnú výber z rozdelenia N (px ,a\), X je jeho výberový priemer a S\ jeho výberovú rozptýl. clalej majme Y1, ...,YnY náhodný výber z rozdelenia N(pY,aY), Y je jeho výberový 1X a a y priemer a SY2 jeho vúýberovýú rozptýl. Predpokladajme, ňze oba výúberý súú nezaúvislúe. Potom (i) ak sú aX a aY známe, tak 100(1 - a)% interval spolahlivosti pre px - pY je a2 a2 X - Y - u1— Y W + ,X - Y + u1—Y W + \ 2 y _x ny 2 y nx (ii) ak sú aX a aY nezname, ale platí a\ = aY = a2, tak 100(1 - a)% interval spolahlivosti pre px - pY y nx ny j je /y v + a ^ /(nx - 1)SX + (_y - 1)SY Inx + ny \X - Y - tnx +nY — 2(1 - 7T)\ -1-ô-\/ \ 2 y _x + ny - 2 y 2 ) V _x + ny - 2 V _x ny 86 a) / (nx — 1)SX + (ny — 1)S^" jnx + nY \ 2 y nX + nY — 2 y nX nY X — Y + tnx +nY — 2(1 oM, . r, 1/ 2 nX + nY — 2 nXnY (iii) ak sú *X, *y,aX,aY nežnúme, tak 100(1 — a)% interval spolahlivosti pre ^ je SX i a ^SX i a \ SY Fnx — 1,nY —1(1 ~2 ) SY Fnx — 1,nY —1( ~2 )/ (Fnx — 1,nY — 1 (1 — %) je (1 — %) kvantil Fnx — 1,nY — 1 roždelenia). Doôkaž: Spravte ako cviňcenie, vyuňžite ňstatistiky ž Vety 19.7. Eňste pre uúplnosňt si uvedieme bež doôkažu interval spoňlahlivosti pre roždiel strednúych hodnôot u tžv. paúrovyúch vúyberov. Veta 19.9. Nech X1 = (X1,Y1)', Xn = (Xn,Yn)' je nahodnú vúber ž dvojrožmerneho normalneho / aX Qax aY\ 2 roždelenia N(/lx, S) s paramertami fi = (*X,*Y)' a S = 2 , pricom *X,*Y g R, aX > \gax aY aY J 0, aY > 0, g g (0,1). Pre i = 1, 2,-, n ožnacme Zi = Xi — Yu Z = n ^ Zi, S% = n—1 — Z)2. Potom ' a Sz Ty , , ,1 a, Sz z — tn—1(1 — 2) -n,Z + tn—1(1 — 2) -n^ 2' yn' v 2' y/n, je 100(1 — a)%—ny interval spolahlivosti pre *X — *Y. Niekedy sa takemuto intervalu spolahlivosti hovorí aj intervalovy odhad *X — *Y o spolahlivosti (1 — a). 20. Testovanie hypotúež Ukažeme si, v com spocíva (v matematickej statistike) podstata testovania hypotež. Myslíme túm statistickúe testovanie hypotúež, niekedy tie ž hovorúíme o testovanúí statistickyúch hypotúež. Majme nahodny vyber X = (X1, ■■■,Xn)', pricom nevieme, ci pochúdža ž roždelenia N(*0,a2) alebo ž N(*1,a2), požnúme *0, (*0 = *1) aj a2. Maúme hypotúežu (tžv. nulovuú hypotúežu) H0: vúber pochadža ž roždelenia N(*0, a2) Tžv. alternatúívna hypotúeža (konkurujuúca) je H1: vúber pochadža ž roždelenia Na2) Rožhodnutie bude take, že platnost H0 nezamietneme alebo zamietneme. Pri rožhodovanúí o platnosti H0 alebo H1 sa moôžeme dopusti t jednej ž dvoch chyúb. (i) Ak žamietneme H0, hoci ona platí (je spravna), urobíme tžv. chybu prvého druhu. (ii) Ak nežamietneme H0, hoci nie je spravna (t.j. platí H1), urobíme chybu druhého druhu. Svoje rožhodovanie žaložíme na realižúcii x = (x1, x2, xn)' nahodneho vyberu X. Preto bude "ovplyv-nenúe" naúhodou. Prirodžene poňžadujeme, aby rožhodovacie pravidlo, podňla ktorúeho žamietneme alebo neža-mietneme H0 bolo takúe, aby pravdepodobnosti oboch chyúb boli ňco najmenňsie. Kedň rožsah naúhodnúeho vyúberu n je pevne urňcenyú, nedajuú sa pravdepodobnosti oboch horeuvedenúych chyúb suúňcasne urobiňt takúymi malyúmi, ako by sme si priali. Zauňžúívalo sa trvaňt na poňžiadavke, aby pravdepodobnosňt chyby prvúeho druhu bola rovnaú a, kde a je vopred žvolene cúslo ž intervalu (0,1). V praxi sa ukažalo vhodne volit a g {0,1;0,05;0,01}. cúslu a sa hovorú hladina významnosti testu. Pravdepodobnost chyby druheho druhu ožnacme (3. 87 Štatistické rozhodovanie prebieha tak, že sa dopredu určí tzv. kritický obor (kritická oblast) W (G R"), t.j. množina realizácií x, pri ktorých budeme H0 zamietat. Teda ak sa realizuje x G W, tak H0 zamietneme. Tvar kritickeho oboru stanovujeme tak, abý za platnosti H0 padla realizácia x do kritickeho oboru "zriedka", ale za platnosti H1 tam padla "co najcastejsie". Velkost kritickeho oboru volíme tak, abý sme platná H0 zamietali s pravdepodobnostou a. Na testovanie (rozhodovanie) pouzijeme "vhodná" statistiku T = T (X), ktorá nazývame testovacia statistika. V takom prípade popíseme kritická oblast ako mnozinu T (W). Teda H0 zamietneme, ak T (x) G T(W). Vratme sa k testovaniu Ho: váber pochadza z rozdelenia N(/j,0, a2) oproti alternatívnej hýpoteze H\: váber pochadza z rozdelenia N(^1,a2). Pouzijeme testovaciu statistiku T (X) = X = " E "=1 X%. Vieme, ze (v nasom prípade) za platnosti H0 bude X — N(p0, "), teda realizácie x budá (pri dost velkom n) blízo /j,0. Navrhneme take rozhodovacie (testovacie) pravidlo, ze ak \x — [i0\ > k, tak zamietneme H0. Teda "tvar" kritickej oblasti je {x : x G (—co,[i0 — k) U (/j,0 + k, to)}. "Velkost" kritickej oblasti (teda cáslo k) voláme tak, abý pravdepodobnost chýbý prveho druhu bola a, teda abý realizácia x padla do kritickej oblasti za platnosti H0 s pravdepodobnostou a. Inými slovami chceme abý P{\X — M0i > k} = a, pricom X — N(p0, "). Zrejme a=p {\x — M0\> k}=p {\\> k vn}^ p {—k vn < X—^° < k vn}=1 — a. je zrejme, ze -^Jn, = u1-a. Kriticka oblast testu H0 oproti H1 s hladinou ,/n a 2 a významnosti a (pri pouzití testovacej statistiký X) je Wa = {x : \x — ^i0\> ui_a —=}. 2n Treba si v simnuá t, ze nezamietnutie H0 neznamenáa, ze H0 je spraávna. K tomu, abý sme pova zovali H0 za spravnu, potrebovali bý sme mat este záruku, ze (3 je dost male. Potom bý sme mohli hovorit, ze H0 prijáímame. Testova t H0 na hladine výáznamnosti a len zaru cuje, ze zamietnutie nulovej hýpotáezý, hoci je spráavna nastane s pravdepodobnos tou a. V sledovanom príklade sme mali tzv. jednoduchá hýpotezu H0 - testovaný parameter (stredna hodnota) v prípade platnosti H0 mohol nadobudnát len jednu hodnotu, a síce /j,0. Aj alternatíva H1 bola jednoducha. Pri testovaná hýpotáez obýŠcajne predpokladaáme, Šze parameter rozdelenia pravdepodobnosti náahodnáeho výáberu X je 6 = (01,ôm)' G 0 c Rm, kde 0 je parametrický priestor - otvorena a neprázdna mnozina. 00 c 0 a 01 = 0 — 00 sá dve "konkurujuce si" moziný. H0 : 6 G 00 a H1 : 6 G 0 — 00. Pretoze H0 aj H1 nie sá vo vŠseobecnosti jednoducháe, hladina váýznamnosti testu s kritickou oblasŠtou W je sup Pe(X G W). 0 e 0O Tiez sa uvazuje sa funkcia ((6) = P0(X G W), 6 G 0. Vola sa silofunkcia testu s kritickou oblastou W. Niekedý sa pracuje s funkciou 1 — ((6), ktorá sa vola operacna charakteristika testu. Ak je H1 jednoducha, (teda H1 : 6 = 61, tak 1 — ((ô1) sa volá sila testu. Prehlad niektorých výbraných testov pre jeden nahodná výber X z Na) rozdelenia (x je realizácia X a s2 je realizácia S2): 88 H0 : M = Mo Hi : / = /o Wa Ho : m = /o Hi : / > /o Wa Ho : m = /o Hi : / < /o Wa Ho : m = /o Hi : / = /o Wa Ho : m = /o Hi : /> /o Wa Ho : m = /o Hi : / < /o Wa {x : |X — /o ^y^n > aui-a } a2 je známe {x : (X — /io)^Jn > aui-a} a2 je známe {x : (X — /io)^Jn < —aui-f} a2 je známe {x : \X — /oI^Jři > stl-i(1 — f)} a2 neznáme {x : (X — M^^/ři, > stn-i(1 — a)} a2 neznáme {x : (x — Mo)Vň < —stn-i(l Ho : a2 = ao, Hi : a2 = a2 Wa = {x : ^s2 i (x2n_i(f ),x2n_i(1 a)} a neznáme Ho : a2 Ho : a2 ao2 Hi : a2 > ao2 ao2 Hi : a2 < ao2 Wf = {x : ^s2 > xl-i(1 — a)} Wa = {x : ^s2 < xl-i(a)} f))} m neznáme / neznáme M neznáme Prehlád niektorých vybraných testov v prípáde dvoch nezávislých náhodných výberov, á síce X = (Xi, ...,XlX)' z Nx,ax) s výberovám priemerom X á váberovým rozptýlom SX á Y = (Yi, ...,YlY)' z S2 = SXY = Ny , aY) s výberovám priemerom Y á výberovým rozptýlom S je reálizáciá X (Y), s2X (sY) je reálizáciá S2X (SY) á s2XY je reálizáciá S (nx — 1)SX + (nY — 1) SY2 nx + «y — 2 'x ,ay Ho : Mx = My Hi : /x = My Wf {(x', y')' : Ix — yI> m--y/ g + lí } a2X = aY neznáme Y Ho : = My Hi : = My Wf = {(x', y')' : IX — yl > tnx +iy-2(1 )sXYyf } M x , My neznáme Ho : a2x = aY Hi : aX = aY Wf = {(x', y')' : ^ i (Fix-i,iy-i(f ),Fix-i,iy— f))} Poznámka. Námiesto hládiný význámnosti a bezná státistický softver (STATISTICA, S+, SAS) udává dosiáhnutá hládinu (ánglický P—value, signiňcance value, signiňcance level). Je to nájmensiá hládiná význámnosti testu, pri ktorej bý sme (pri dánej reálizácii testovácej státistiký) hýpotezu Ho este zámietli. Výjádruje právdepodobnost spocítáná zá plátnosti nulovej hýpotezý, ze dostáneme práve násu reálizáciu álebo reálizááciu e ste viác odporujuácu testovánej hýpotáeze. Pri "výberání" vhodneho testu postupujeme ták, ze medzi testámi ná (pozádovánej) hládine význámnosti a sá snázíme zvolit test s co nájmensou právdepodobnostou chýbý druheho druhu. To ále ukázuje práve funk-ciá (3(6). Obom poziádávkám sá (niekedý) dá výhoviet v jednoduchom prípáde, á síce ák máme jednoduchá hýpotezu Ho : 6 = 6o oproti jednoduchej álternátíve Hi : 6 = 6i. Hovorí o tom následujácá vetá. Veta 20.1. (Neýmánová-Peársonová lemá) Májme náhodný vektor X = (Xi,Xn)' s hustotou f (x, 6). Nech k dánemu a i (0,1) existuje táke c > 0, ze pre mnozinu (20.1) Wc = {x : f (x, 6i) > cf (x, 6o)} plátáí (20.2) f f(x,6o)dx Potom pre kázdá merátelná mnozinu W táku, ze f f (x, 6o)dx lX lY = a. =a 89 platí (20.3) f f (x, eí)dx > í f (x, eí)dx. ■Jwc Jw Dôkaz: Množiny W a Wc sa môžu napísat ako w = (W - wc) u (W n wc), wc = (Wc - W) u (W n wc). Počítajme teraz f f (x, 6i)dx -f f (x, 6i )dx = ■JWc JW f f (x, eí)d,x + / f (x, eí)dx- JWC-W JW nWc f f (x, 6í)d,x -f f (x, 0ľ )dx > JW-Wc JwnWc > c f (x, 0o)dx - c f (x, 0O )dx JWC-W JW-Wc = c/ f (x, 0o)dx + c f (x, 0O )dx- JWc-W JW nWc z( f (x, 0o)dx - c f JW-Wc JW -c f(x, 0o)dx - c f(x, 0o)dx = 'W -Wc JW nWc = c\ f (x, 0o)dx - c f (x, 0o)dx = ca - ca = 0, JWc JW lebo na množine Wc - W je í f (x, 0i)dx > c f f (x, 0o)dx JWc-W JWc-W a mimo množiny Wc je f f (x, 0ľ)dx < c f f (x, 0o)dx, JW-Wc JW-Wc í f (x, 0i)dx >-cf f (x, 0o )dx. * JW-Wc JW-Wc Veta 20.1. teda tvrdí, že ak máme testovat jednoduchú hypotezu oproti jednoduchej alternatíve a sú splnene podmienky (20.1) a (20.2), tak test s kritickou oblastou Wc ma hladinu vúžnamnosti a a pre akykolvek test s hladinou vyžnamnosti a je podla (20.3) sila testu s kritickou oblastou Wc vačsia. Test s kritickou oblastou Wc je najsilnejsí možny medži vsetkúmi testami s hladinou vyžnamnosti a. Príklad 20.1. Majme nahodny víber X = (Xi, ...,Xn)' ž roždelenia N(/x, a2), pricom a2 požníme. Níjdite najsilnejsí test nulovej hupotežy Ho : / = /xo oproti alternatívnej hypoteže H1 : / = kde Mo < /i. Riesenie: Pretože f (x,M,a2) = (27ra2)-n e-2^ ^7=i(x*-k)2 , je kriticky obor ž Neymanovej-Pearsonovej lemy Wc í x : f (x,Mi,a2) = e-^ (Eľ=1(-i-M1 )2-Eľ=1(xi-Mo)2 > cl c f(x, / o, a2) 90 teda "Úpravou dostavame Wc = jx : (j=2(xH - Mo )2 - ^(xi - mi)2 ) > ln c ] 2 j > ln c| í _ 2a2 Wc = { x : 2x(mi - Mo) - (m2 - M2) > -ln c Wc = < x : x > -—^--+ a2 Wc = •( x : -— V n > 2 ' n(Mi - Mo) lnc 2 —r-^-y ln c — m0 (20.4) x - m0 Ml - Mo 7— + a ln c a 2a V—(mi - Mo) Wc = < x : -a/— > —--a/— Treba nám eSte urCit c. Jeho hodnotu spoCítame z podmienky a = í f (x,Mo,a2)dx = P^o(X g Wc) = PMo{u : X(u) G Wc} í X(u) - Mo r . Mi - m0 i- Piuj : -v— >—7,-v — a 2a a ln c + ^-) j V—(Mi - Mo) Pretože X J10 \[—> ~ ^(0,1), dostavame, že a ln c "ô-v— + "7=7-ľ = «i-a> 2a V—(Mi - Mo) 2s/—(mi - Mo)aui-a - —(mi - Mo)2 c = e 202 Jednoduch sie ur cenie Wc je ž (20.4) í X - Mo r- 1 í — a 1 Wc = < x : -v— > ui-a) = \ x : x > m0 + ui_ a } ■ l a J l V—) Poznámka. Podobne by sme v prípade hladania najsilnejsieho testu nulovej hupotezy Ho : m = Mo oproti alternatívnej hypoteze Hi : m = Mi, ked m0 > Mi odvodili, že v tomto prípade Ho zamietame na hladine vyážnamnosti a ak x - Mo 1— -v — < -ui-a. Úrobte ako cviCenie. DODATOK Platí / (cos bx)e 0,2x2dx = ^-e Jo 2a b2 4a2, a> 0, cos bx o 1 + x2dx 2e ' b' xne-ax dx = V n+i , a> 0,n> -1. Jo 2a 2 Dôkazy najdete v ucebnici matematickej analyzy. oo