M3121 Pravděpodobnost a statistika I M4122 Pravděpodobnost a statistika II (prednášky) 1. Pravdepodobnostný priestor M3121 je základný kurz teorie pravdepodobnosti, na ktorý nadväzuje M4122, v ktorom sú základy matematickej statistiky. Skúšat sa bude látka obidvoch semestrov naraz v lete. Cvičenia sú velmi dôležité. Podmienky získania kreditov v ZS: - maximálne 3 neospravedlnené neúčasti na cvičeniach a súčasne - zisk minimálne 10 bodov z písomky (ohodnotená je maximálne 20 bodmi). Podmienky získania kreditov v LS: upresní prednášajúci. História (stručne) teórie pravdepodobnosti sa nájde na www.math.muni.cz / ^budikova / prf/historie.pdf Literatúra: Dupač, V., Hušková, M., Pravděpodobnost a matematická statistika, Karolinum, Praha, 2001. Zvára, K., Štěpán, J., Pravděpodobnost a matematická statistika, Matfyzpress, Praha, 2001. Teória pravdepodobnosti je matematická disciplína, ktorá modeluje a popisuje náhodný pokus - pokus, ktorého výsledok dopredu nepoznáme. Teda výsledok pokusu nie je jednoznačne určený podmienkami, za ktorých je realizovaný. Napr. hod kockou. Pokusy, ktorých výsledok je jednoznačne daný podmienkami sa volajú deterministické. My budeme popisovat tzv. stochastické pokusy. Pritom presnejšie nás zaujímajú také náhodné pokusy, pri ktorých je náhoda akási "regulárna". Konkrétne ak A je lubovolný sledovaný náhodný jav, tak požadujeme, aby vykazoval pri opakovanej nezávislej realizácii náhodného pokusu tzv. štatistickú stabilitu, t.j. aby relatívna početnost fn(A) = ^ n výskytu javu A v postupnosti n nezávislých pokusov (pričom n a je počet nastatí javu A) sa príliš nemenil a s rastúcim n mal "tendenciu" držat sa nejakej konštanty. Obrazne (nepresne) zapísané linin^oo fn(A) — p(A). Toto neplatí (úplne) napr. o futbalovom zápase, o predpovedi počasia, atd. Budeme teda budovat matematickú teóriu - model náhodného (štatisticky stabilného) pokusu. Značenie: íl ... Množina všetkých možných "najjemnejších" výsledkov náhodného pokusu, ktoré ešte treba rozlišovat. Predpokladáme, že vždy íl je neprázdna. íl voláme priestor elementárnych javov. oj ... Elementárny jav, prvok íl; íl môže byt konečná, spočítatelná aj nespočítatelná; uj je "najjemnejší" výsledok náhodného pokusu. A, B, Ai, A2,An ... náhodné javy (udalosti) 1 2 0 ... nemožný jav íl ... istý jav A U B ... jav, ktorý nastane ak nastane alebo A alebo B A n B ... jav, ktorý nastane ak nastane aj A aj B A — B ... jav, ktorý nastane ak nastane A a nenastane B A — Ac — íl — A ... opačný jav k javu A UiLi ■■■ nastane, ak nastane aspoň jeden z javov A±,An Uj=i ■■■ nastane, ak nastane aspoň jeden z javov A±, A2,... PliLi ^4 ■■■ nastane, ak nastanú všetky javy Ai,An CliĹi Ai ... nastane, ak nastanú všetky javy A\, A2,... exp íl — 2n ... systém všetkých podmnožin íl A c B ... ak nastal jav A, tak nastane jav B (A implikuje B) Pri náhodnom pokuse okrem priestoru elementárnych javov íl musíme mat zadaný (popísaný) aj systém náhodných javov. Definícia 1.1. Nech íl je lubovolná neprázdna množina. Neprázdny systém A podmnožin množiny íl sa nazýva u—algebra, ak platí (1.1) (i) AeA=^AceA 00 (1.2) (ii) Ax, A2,... g A (J A, e A (cr-aditivita). 4=1 Ukazuje sa rozumná požiadavka odrážajúca naše skúsenosti, aby systém náhodných javov A v popisovanom náhodnom pokuse bol a—algebrou podmnožin množiny elementárnych javov íl. Dvojicu (íl, A.) nazývame javové pole a lubovolný prvok A e A nazývame náhodný jav (vzhladom k (n,A)). Poznámka (íl, A) s volá aj meratelný priestor. Poznámka uj— elementárny jav nie je náhodným javom, ale \uS\ ako podmnožina íl je náhodným javom ak patrí do A. Povieme, že náhodný jav A nastal, ak (elementárny) výsledok pokusu bol uj, pričom uj g A. S náhodnými javmi narábame preto ako s množinami. Platia tu de Morganove vzorce (1.3) yZ=n^ 4>1 4>1 (1.4) nz= 4>1 (Dôkaz (1.3): lú e (Jí>i Al uj £ Uí>:L Al v i > 1 platí uj £ Al a>iÄ. Dôkaz (1.4) si urobte sami.) Veta 1.1. Nech (íl, A) je javové pole. Potom platí v i > 1 platí w g Aj <í=> uj g (1.5) íl e. A, 0 g A, 3 a pre lubovolné prirodzené n a A,An, A, B e A n n (1.6) [j A, e A, p| A, e A, A-B e A, i=l i=l a tiež oo (1.7) A1,A2,... eA=^ f| An e A. n=l Dôkaz: A je neprázdny systém, teda 3 A e A. Z (1.1) vyplýva, že A e A. Z (1.2) vyplýva, že ak A = A g .4,3 = A e A A = A, A = A,tak A u A u A u ... = íí g 4. Z (1.1) tiež ň = 0 e 4. Ďalej ak A1,A2,4„£ia tiež 0 = A^i, 0 = A„+2,... g 4, tak z (1.2) Ai U A2 U ..A„ u 0 u ... = Ak Ai,A2, ...,An e 4, teda Ai,A2, ...,An e A, a. Uľ=i ^ "= ale P°dla de Morganovho pravidla (1.4) Je Uľ=i ^ = flľ=i ^ a Preto íT=i ^ e A ale podlá (1.1) P|ľ=i ^ e A pričom f|ľ=i ^ = íT=i Teraz nech A,B e A. Z (1.1) B g 4 a z množinovej rovnosti A — B — AD B dostávame, že A — B e A. Nech Ai,A2,... e A. Preto aj Ai,A2,... e A, teda U^Li ^« e A a. pomocou (1.1) a de Morganových pravidiel aj U^Li An = fX°=i -4« e A * Definícia 1.2. Majme postupnost náhodných javov {An}^=1. Hornou limitou postupnosti javov {Ai}^Li nazývame množinu všetkých uj e íl, ktoré patria do nekonečne vela javov An. Označujeme ju limsup^^^ An. (Inak povedané limsup^^^ An nastane práve vtedy ak nastane nekonečne vela javov An.) Definícia 1.3. Majme postupnost náhodných javov {A^}^^. Dolnou limitou postupnosti javov nazývame množinu všetkých uj e íl, ktoré patria do všetkých An s výnimkou konečného počtu týchto javov. Označujeme ju liminf„^oo An. (Inak povedané liminf„^oo An nastane práve vtedy ak nastanú všetky javy An s výnimkou konečne vela týchto javov.) Lenia 1.1. Ak je postupnost náhodných javov na (íl, A), tak lim inf „^oo An c limsup„^ Dôkaz: Zrejmý z definícií 1.2 a 1.3. Veta 1.2. Ak {An}™^ je postupnost náhodných javov na (fŽ, A), tak platí oo oo (1.8) lim sup An = f) (J A n—>oo -, , n—l k—n oo oo (1.9) lim inf An = M f| A n—>oo n=l k= (1.10) lim sup An — lim inf An. n—í-oo n 5,00 Dôkaz: uj G limsup^^^ An <í=> uj patrí do nekonečne vela javov An <í=> pre v n > 1 ] > n, že c g A ^ v n > 1 je c g Uľ=„^ ^ c g f|~ i IX„^- uj e lim inf „^oo An <í=> uj patrí do každej An s výnimkou konečného počtu A 3 n > 1, že uj e limsup^^^ An ■<=>■ neplatí, že uj patrí do nekonečne vela javov An <í=> neplatí, že\/n>í3k>n, že uj e A 3n>lVk>nu<£Ak ^=^> 3 n > \ M k > n uj e~Ä^ 3 n > 1, že uj e f|^L„ Ä w £ U^Li ClkĹn Ak = 1™ inf™^oo An. & 4 Definícia 1.3a. Majme postupnost náhodných javov {An}^=1. Povieme, že postupnost {An}^=1 má limitu A, ak A — limsup^^^ An — liminf„^oo An. Označujeme A — lim„^oo An. Poznámka. Ak A\, A2,... g A a 3 A — limsup^^^ An — liminfn^oo An — U^Li Plfcln Ak <= A (teda limita je z .4). Samozrejme z Vety 1.2 vyplýva, že aj limsup^^^ An g A a liminf„^oo A„ g A Veta 1.3. Nech {An}^^ je postupnost náhodných javov na (íl, A). Ak A\ c c .... Potom 3 lim„^oo A„ a platí lim„^oo A„ — U^Li Ai- Dôkaz: f|£L„ Ak = A, preto w e lim inf^^ An ^=^> w e U^Li ClkLn Ak = U^Li An, čiže liminf^oo A = U„=l Ai- Aj limsup„^oc An — \Jn°=i A-n, lebo z Lemy 1.1 U^Li -4« = liminf^oo A c limsup„^oc An a naopak ak w g limsup^^^ An <í=> w patrí do nekonečne vela An <í=> ui g U^Li čiže limsup^^^ An c U^Li Preto 3 lim„^oc A = (J^Li A„. & Veta 1.4. Nech {Ai}J£Li je postupnost náhodných javov na (íl, A). Ak A ~D A2 2 ■■■■ Potom 3 lim„^oo A a platí lim„^oo A = íXLi Ai- Dôkaz: (J£L„ A = An, preto w g limsup„^oc An ^> w g |XLi Ufcl„ a = iXLi aí, čiže limsup„^oc An = n„=i Ai- Aj liminf„^oo A = íXLi An, lebo z Lemy 1.1 liminf„^oo An c limsup„^oc A — Pl^Li Ai a naopak ak u; g H^Li Ai w patrí do všetkých A ^=^> ui g liminf„^oo An, čiže H^Li Ai £ liminf„^oo An- Preto 3 lim„^oc An = f|^Li A^ * Veta 1.5. Nech S je neprázdny systém podmnožin íl. potom existuje množinová cr—algebra o (S) taká, že platí (i) S c ,7(5), (ii) ak je A* množinová cr—algebra taká, že S c .4*, tak u(S) c .4*. Dôkaz: Položme cr(, x g R} c exp íl — exp R Minimálna množinová cr—algebra cr(S) — B generovaná systémom S sa volá horelovská (množinová) cr—algebra v R. Jej prvky sa nazývajú borelovské množiny. Poznamenávame len, že borelovská cr—algebra v R je totožná aj s minimálnou množinovou cr—algebrou generovanou systémom množín S všetkých intervalov tvaru < a, b), kde a < b (pozri napr. Riečan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972, str. 46). 5 Analogicky definujeme Bn. n = r™, S — {(—oo, x\ > x... x (—oo, xn >, x±, ...,xn g r}, (t(S) — Bn je borelovská (množinová) c—algebra v r™. Definícia 1.5. (Axiomatická definícia pravdepodobnosti.) Nech (íl, .4) je javové pole a P reálna množinová funkcia definovaná na A s vlastnostami (i) P(íl) — 1 (normovaná) (ii) \/ Ae A P (A) > 0 (nezáporná) (iii) ak {Anj-^-L je postupnost po dvoch disjunktných (nezničitelných) náhodných javov (t.j. V n An g A: An n Am = 0 pre n ^ m), tak P (Uľ=i) = Eľ=i (^-aditívna). Potom funkciu P nazývame pravdepodobnosťou (na Á) a trojicu (íl, A, P) pravdepodobnostným priestorom. Poznámka. Axiomatickú definíciu pravdepodobnosti a pravdepodobnostný priestor zaviedol N.A.Kolmogorov v roku 1933. Poznámka. Pravdepodobnostný priestor je matematickým modelom (regulárneho) náhodného pokusu. Príklad 1.1. Nech íl je konečná množina elementárnych javov, t.j. íl — {wi, ...,ujn},A = expíl Pre A = {w^,ujlk} c nech P(A) = Ej=i ^(1^ })> pričom V i P({wJ) > 0, X)ľ=i -f ~ 1- Potom (rž, ^4, P) je pravdepodobnostný priestor. Špeciálne: Ak v Príklade 1.1 je P({ljí}) — ^ pre i — 1,2, ...,n, tak hovoríme o klasickom pravdepodob-nostnom pokuse (klasickej definícii pravdepodobnosti, klasickom pravdepodobnostnom priestore), pričom P(A) M P{A) ~ Ifil (|A| je počet elementárnych javov v A). Váhová definícia pravdepodobnosti: Nech íl je nanajvýš spočítatelná množina, teda íl — {uj\, cj„, ...}, A exp íí, P{A) = £Ui.eAP(K}), pričom V n P({^„}) = p„ > 0 a Eľ=i ^(K}) = 1- Geometrická definícia pravdepodobnosti: Nech íl g Bn je borelovská množina, ktorej Lebesgueova miera /i(íl) je konečná a kladná, A — S™(íl) (systém všetkých borelovských podmnožin íl), pravděpodobnost i>(A) = 4$preAeA 6 2. Vlastnosti pravdepodobnosti Veta 2.1. Nech (íl, A, p) je pravdepodobnostný priestor. Potom pravděpodobnost p má nasledujúce vlastnosti: (i) p(0) = 0 (ii) A, B e A, A n P = 0 =4> p (A U B) — p (A) + p (B) (iii) A, B e A, A d B p(P — A) — p (B) - p(a) (subtraktívnost) (iv) A, B e A, A d B => p (A) < p (B) (monotónnost) (v) A e A 0 < p (A) < 1 (vi) Ae A => P (Ä) = 1 - p(a) (vii) A, B e A p(a UB) = p(a) + p (B) - p (A n B) (viii) A,An e A p (UU A) = Eľ=i ^(A)- - Eľ^i1 E-=i+i P{A, n A,-) + Eľ=ľ YT3=l+1 ELJ+i ^(A n A,- n Ak) +...+ +(-i)«+1p(An4n...nA,) (ix) A,A, e A p (Uľ=i A) < Eľ=i p(Aí) Dôkaz: (i) P(íl) = P(íí U 0 U ...) = P(íí) + p(0) + ... = 1 p(0) = 0; (ii) A, B e A, A n P = 0 =4> p (A U P U 0 U ...) = p(A) + p (B) + p(0) + ... = p(A) + p(P); (iii) , (iv) A, B e A, A C B B = All(B-A) (nezničitelné). Teda p (B) = p(a) + p (B - A) a, preto p(P - A) = p(P) - p(A), ale aj p(a) = p(P) - p (B - A). Keďže p (B - A) > 0, je p(P) > p(A); (v) A e A 0 e A, 0 c a c íí (z (i),(iv)) 0 = p(0) < p(a) < p (íl) = 1; (vi) Aei,AuI = í] =^(z (ii)) 1 = p(fi) = p(a uä) = p(A) + p (ä), čiže p(ä) = 1 - p(A); (vii) A, B e A, teda sadá písat AUP = A-(AnP)]U(,4nP)U[P-(,4nP)] (disjunktně) => p(AUB) = p(A — (AnB)) + p (A n B) + p(B — (AnB)) — (z (iii)) p (A) - p (A n P) + p (A n P) + p (B) - p (A n P) = p(A) + p(P)-p(AnP); (viii) indukciou pomocou (vii) (pozri napr. Riečan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972) (ix) p (ur=1 a) = p (ut7 ^) + p(a„) - p (a„ n UľJi1 a) < i3 (UľJi1 a) + ^ (UTi1 a) = ^ (Uľ=i2 a) + i>(a,-i) - p (4-i n Uľ=i2 A) < p{\£=? a) + P(An-1) P(A U A2) = P(A) + p(A2) - P(A n A2) < p(A1) + p(A2) a sčítaním máme P ((J"=1 A) < f (4) + p(A2) + ■■■ + p(An). * 7 Veta 2.2. Nech (£l,Ä) je javové pole, P reálna množinová funkcia definovaná na A s vlastnostami (i) P(Q) = 1 (ii) \f A e A P (A) > 0 (iii) A, B e A, AOB = $ => P(A u B) = P(A) + P {B) (aditivita, nie cr-aditivita) Potom nasledujúce vlastnosti sú ekvivalentné (1) P je pravděpodobnost na (Í2, A) (2) ii,i2,-eA4c4+1 lim„^oo P(An) — P (Ui^i -4i) = -P(lim„^oo -4«) (spojitost zdola) (3) A1} A2,... G A, An D A„+1 lim„^oo P(A„) = P (Hi^i -A) — -P(nnin^oo Ai) (spojitost zhora) (4) A1,A2,...eA,An^An+1,(X^=iAn^^ lim„_!.00 P(A„) = 0 (spojitost zhora v 0). Dôkaz: (1) =>• (2) P je cr—aditívna, teda ak P1; P2, ■■■ e A,Bi<~) Bj — 0 pre í ^ j =4> P (Ui*li 5i) — Ei*li P(Bi). Položme Pi = Ai, P2 = A2 - Ai, P3 = A3 - A2,.... Platí U^i A, = (Ji^i B, a B, n Bj = 0 pre z ^ j. Dostávame P (U=i A) = P (U~ i ^) = Eľ=i P{Bn) = lim™ Eľ=i Pm = lim^o^Si) + P(P2) + ... + P(P„)] = lim^jP^i) + P(A2) - + ... + P(A„) - P(An^)} = lim^oo P(A„). (2) =>• (3) _ _ _ _ _ A. 2 Ai+i, preto An c A„+1 a podlá (2) lim,,^ P(A„) = P (U=i A) = ^(flSiA:) (de Morgan) = 1 — P (Hľ=i An)- Teda lim™ P{An) = lim™[l - P(Ä7)] = 1 - [1 - P (n~=1 4)] = f (Ílľ=i An)- (3) (4) AkA1,A2,...eA,AnDAn+1, nľ=iA, = 0, tak lim™ P(A„) = P (H^ A) = 5(0) = 0. (4) =>• (1) Nech Pi, P2,... e A. Platí P4 n B j = 0 pre í ^ j. ďalej platí P (U^=i 5*) = 5 (Bi U ... U P„_i U \J°ín Bi). Ak označíme [j°lnBl = C„, potom C„ D C„+i a (X°=i C« = 0 (lebo fl^Li C« = íX°=i LE„ 54 = limsup^^^ Bn — {lú G íl : w patrí do nekonečne vela Bi} — 0, lebo Bi sú po dvoch disjunktné). Teda podlá (4) lim^oo P(C„) = 0. Počítajme pre lubovolné n > 2: 5 (U=i A) = Eľ=i' 5(5,) + p(Cn) (aditivita P). Preto platí: P (U=i 54) = lim™ P (U=! P.) = lim^ooEľ^i1 P(Bl) + P(Cn)} = lim™ EľJi1 -P(^) + Ľm™ P{Cn) = E~i 5(5,). * 8 Veta 2.3. Nech (íl, A, P) je pravdepodobnostný priestor, An e A, n — 1,2,... a existuje lim,,-^ An — A. Potom P(lim„^oo An) = lim„^oo P(An). Dôkaz: Pre reálnu číselnú postupnost {a^^i platí: a je hromadným bodom {an}^^ ak a je limitou nejakej vybranej podpostupnosti z postupnosti {o.„}^=1. Množina hromadných bodov každej reálnej postupnosti má najväčší a najmenší prvok. Najväčší prvok je limsup^^^ an a najmenší prvok je liminf„^oo an. Postupnost {«n}^Li má limitu práve vtedy ak limsup,,^^ an — lim inf „^oo a„ = lim,,-^ o.,, (Jarník, V., Diferenciální počet II, Academia, Praha, 1976). Ďalej označme f\=„A = B„, U=„A = C„, P(Bn) = bu,P(Cn) = c„. Zrejme Bn C P,!+1, C„ 3 C„+i, « = 1,2,.... Podía Vety 2.2 3 lim„^oo bn = lim„^oo P(Bn) = fflXli-8") a P°dla Vety 2.2 3 lim„_>oo c„ = lim™ P(Cn) = P(f)n=lCn)- Z predpokladov vety tiež A — linin^oo An — liminfn^oo An — limsup^^^ An. Počítajme: P(lim™ An) = P(liminf™ A) = P (Uľ=i ClZn A) = f (Uľ=i B») = limn^oo P(5„) = limjwoo bn = liminf,,-^ ů„ = lim inf^oo P (fl^„ A) < liminf„^oo P(An) < limsup,,^ P(An) < limsup„^oc P (U~„ A) = liniSUPn^^ P (Cn) = ĽmSUp^^ C„ - limn^oo Cn = lÍm„^oo P (C n) - P Cn) = ^ (íXil \Sh=n A) = P(limsup„_>00 A) = P(lim„^oo A,)- Preto všade platí rovnost a P(limn_).00 A) = Ľminfn^oo P(A) — limsup„^oc P(A) — (Jarník) lim„^ooP(A). * Veta 2.4. (Borelova-Cantelliho lema) Nech An, n — 1,2,... je postupnost náhodných javov na (íl, A, P) a E^Li ^(AO < oo. Potom P(limsup,MC04) = 0. Dôkaz: 0 < P(limsup™ A) = P(nľ=iU"„ A) = lim™P(U^„A) (Veta 2.2, lebo {U~„A}~ i je kle-sajúca postupnost. Platí tiež: (J~n A = A U A+i U ... = An U (A*+i - A) U (A!+2 - Uľ=n A) U (A+s - U=,ľ A) U pričom An, A+i - A, A+2 - []"=,] A, ••■ sú disjunktně. Preto lim™ i>(U~„ A) = hm™ P((An U (A+i - A) U (An+2 - Uľ=n A) U ...)) = iim™(P(A) + P(A+i - A) + P(A+2 - Uľi! A) + ..-) < ľmi™ YZn PiAi) = = íim™^! P(A) - Eľ=i' ^P(A)) = E~i ^P(A) - E~i p(Aí) = o. Teda P(limsupn^00 A) = 0. 4h 9 3. Podmienená pravděpodobnost Príklad 3.1. Majme urnu s a čiernymi a b bielymi gulkami. Gulku po vytiahnutí nevrátime spät. Označme náhodný jav B\ - v prvom tahu vytiahneme bielu gulku B2 _ v druhom tahu vytiahneme bielu gulku Zaujíma nás pravděpodobnost, s akou v druhom tahu vytiahneme bielu gulku, ak vieme, že v prvom tahu sme vytiahli bielu gulku. Riešenie: Podobne P{B2\B{)= b~hlv a + b — 1 Označenie P{B2\B{) znamená podmienená pravděpodobnost náhodného javu B2 ak nastal náhodný jav B\. Platí tiež p(b n p)- b{b-l) P(BinBj)-(a + i)(a + i-l)' lebo všetkých možností (výsledkov) dvoch tahov je b(b — 1 + a) + a(b + a — 1) — b2 — b + ab + ab + a2 — a — (a + b)(a + b — 1) a "priaznivých" b(b — í). (bí1,bí2) (bÍ!,bí3) ... {biíMb) či) . .. (6ži, ča) (bi2,bii) (bi2,bi3) ... (bi2,bib) (bi2,či) ...{bi2,ča) (bib,bii) (bib,bi2) ... (bib,bib-i) (bib,či) ...(bib,ča) (či,6zi) (či, 6z2) ••• (či,bib) (či,č2) ...(či,ča) (ča,bii) (ča,bí2) ... (ča,bib) (ča,či) . ..(či,Ča_i) Môžeme ale písat b(b-l) P(fí\fí^ P{B2r\B1) (a+6)(q+6-i) b-i F{B2\Bx) = - — = -s- = ——--. P(fii) TTTb a + b-í a+b Teda ohraničili sme sa namiesto íl na B\ (bii,bi2) (bii,bi3) ... (bii,bib) (&«i,či) ...(bii,ča) (bi2,bii) (bi2,bi3) ... (bi2,bib) {bi2,č{) ...{bi2,ča) {bib,bi\) (bib,bi2) ••• {bib,bib-\) (fo&,či) ...(bíb,ča) a z náhodného javu £?2 berieme "len tú časí, ktorá je v Bi". 10 Definícia 3.1. Majme pravdepodobnostný priestor (íl, A, P) a B e A je vybraný náhodný jav taký, že P (B) > 0. Podmienená pravděpodobnost náhodného javu A e A za podmienky nastatia náhodného javu B (3.1) = Poznámka. Z (3.1) vyplýva (3.2) P(ADB) = P(A\B)P(B) pričom sa predpokladá, že p(p) > 0. Pretože A f] B C B, teda p(p) = 0 p(a n B) = 0, vztah (3.2) má význam aj pre p(p) — 0. Vztah (3.2) je "symetrický" aj pre A, teda (3.3) P(AnB) = P(B\A)P(A). Z (3.2) a (3.3) máme (3.4) P(A\B)P(B) = Označenie: Nech jav p e .4 je pevne daný, pričom P (B) > 0. Definujme PB : -4^<0,1> PB(A) = P(A\B). Veta 3.1 Pb je pravděpodobnost na (Í2, .4) (pre každý jav B, pre ktorý je P (B) > 0). Dôkaz: PbW - p{B) - - 1> Pb(A) = > 0 pre \/ A e A An e A, n — 1,2,Aj n Aj — 0 pre z 7^ j, potom p (r\A\_P (U~i ^ n p) _ p qj^CA n p)) _ ty y" ^) " ^) " ^ ' i=l i=l Veta 3.2 Platí (i) P(A\n) = p(a) pre V a e ^ (ii) P(nľ=i^i) = -P(^i)^2|Ai)P(A3|A2nA1)...P(al|A1nA2n...nAn_1) ak p (n^1 ^) > o (veta o násobení pravdepodobnosti). Dôkaz: w y 1 ' p (n) p (n) y (ii) Z(3.2)jeP(nr=iA) = pIau^a^p^a, p (An\ n?=i aS p (a^, n nľ=ľ a 11 p [m nr^1 a) p nľ=ľ a) p (nľ=ľ m p(A1)p(A2\a1)p(A3\a2 n Ai)...P(A„|Ai ni2n ... n a^). * Definícia 3.2. Majme pravdepodobnostný priestor (íl, A, p). Náhodné javy A\,A2,... G A tvoria úplný systém javov, ak platí oo (3.5) Ai nAj = 0, i = 1,2,.... Potom platí oo (3.7) p(B) = Y,p(B\A^p(A>y i=l Dôkaz: p (B) = p(Bníi) = p(BnU"^) = P(UZi(BnA)) = Eľ^^ni.) = YZiP{b\A1)p(A1) (podlá (3.2)) * Veta 3.4. (1. Bayesov vzorec) Nech A\,A2,... je úplný systém javov v pravdepodobnostnom priestore (íl, A, p) taký, že P(a)>0, 2 = 1,2,.... Ak P (B) > 0, tak platí P(B\A3)P(A3) (3'8) ""'t" V- J- = 1'2' Dôkaz: Pre lubovolné j je pomocou (3.2) a (3.7) P(A|5) p(PnA)_ p(b|A,-)í>(A,-) P{B) YJľ=iP{B\Al)P(Aiy Veta 3.5. (2. Bayesov vzorec) Nech Ai,A2,... je úplný systém javov v pravdepodobnostnom priestore (íl, A, P) taký, že P(Ai) > 0, i = 1,2,... . ďalej A G A, že P(A > 0 a P G A Platí Dôkaz: spravte si sami. Poznámka. Vety 3.3, 3.4 a 3.5 platia aj v prípade, že úplný systém javov je konečný. Poznámka. P (Aj) v Bayesových vzorcoch sú tzv. apriórne pravdepodobnosti a P(Aj\B) aposteriórne pravdepodobnosti (po vykonaní pokusu s výsledkom B). Poznámka. V prípade 1. Bayesovho vzorca ide o riešenie situácie, ked máme hypotézy A\,ktoré sa navzájom vylučujú, ale vyčerpávajú všetky možnosti. Poznáme ich (apriórne) pravdepodobnosti P(Ai). Nastal jav A a poznáme pravdepodobnosti P(A\Ai). Pýtame sa na (aposteriórne; nové, ktoré berú do úvahy skutočnost, že mastal Ä) pravdepodobnosti P(Ai\Ä) 12 V prípade 2. Bayesovho vzorca ak nastal jav A, pýtame sa na pravděpodobnost javu B. Poznámka. Nie je vždy jednoduché volit správny pravdepodobnostný model pre výpočet podmienených pravdepodobností. Príklad 3.2. (Lekárska diagnostika) Vieme, že určitou (konkrétnou) chorobou Ch trpí 1% populácie. Choroba je diagnostikovaná na základe vyšetrenia, ktorého spolahlivost je (i) 95% ak vyšetrovaná osoba trpí chorobou Ch (ii) 70 % ak vyšetrovaná osoba netrpí chorobou Ch. Vyšetrujeme náhodne zvolenú osobu. Určte pravděpodobnost správnej diagnózy, ak výsledok vyšetrenia je (a) pozitívny (podlá výsledku vyšetrenia je osoba chorá) (b) negatívny (podlá výsledku vyšetrenia je osoba zdravá). Riešenie: Označme jav A - vyšetrovaná osoba trpí chorobou Ch (je chorá) B - výsledok vyšetrovania je pozitívny Zo zadania vieme P (A) — 0.01 (pravděpodobnost, že vybraná osoba je chorá) Táto pravděpodobnost sa volá prevalencia alebo tiež apriórna pravděpodobnost choroby Vyšetrenie (spolahlivost vyšetrenia) sa charakterizuje dvomi charakteristikami, a síce pravdepodobnosťou P(B\Ä) — 0.95 tzv. citlivosť testu alebo aj senzitivita testu pravdepodobnosťou P(B\Ä) — 0.7 tzv. špecificita testu, (a) Máme určit vlastne P(A\B) (lebo v tomto prípade výsledok testu bol pozitívny, teda test hovorí, že vyšetrovaná osoba je chorá (diagnóza je, že pacient je chorý) a my máme určit pravděpodobnost správnej dignózy). Zo zadania vieme, že P {A) = 0.01, P (Ä) = 0.99, P{B\A) = 0.95 a P(B\Ä) = 1-P(B\Ä) = 1-0.7 = 0.3. Podlá Bayesovho vzorca (A, A sú hypotézy) P(A\B) = P(A)P(B\A) = 0.01 -0.95 = 1 1 1 P(A)P(B\A) + P(A)P(B\A) 0.01-0.95 + 0.99-0.3 Je to aj aposteriórna pravděpodobnost, že pacient je chorý, ak výsledok testu bol pozitívny. Je to prekvapivý výsledok, čakali by sme "omnoho lepší" výsledok. 13 Celkom máme 29 700 + 950 — 30 650 pozitívnych výsledkov, z toho správne pozitívnych je 950, čiže (b) Analogicky (zase A, A sú hypotézy) P(Ä)P(B\~Ä) 0.99 • 0.7 P A\B) —_=____i_!_-_=_=_= 0 99928 V 1 ' P{Ä)P{B\Ä) + P{Ä)P{B\Ä) 0.99-0.7+ 0.01-0.05 Je to aposteriórna pravděpodobnost, že pacient nie je chorý, ak výsledok testu bol negatívny. Naozaj celkovo máme 69 300 + 50 — 69 350 negatívnych výsledkov, z toho správne negatívnych je 69 300 a teda __ 69300 pravděpodobnost správnej diagnózy u negatívnych výsledkov testu je P(A\B) — -— 0.99928. 69350 Nezávislost náhodných javov Definícia 3.3. Majme pravdepodobnostný priestor (íl, A, P). Náhodné javy A, B G A sú nezávislé (vzhladom k pravdepodobnosti P) ak P (A D B) — P (A) P (B). Definícia 3.4. Majme pravdepodobnostný priestor (Í2, A, p). Náhodné javy A\, A2,... G A sú skupinovo (združené) nezávislé (vzhladom k pravdepodobnosti p) ak pre lubovolné k G {1,2,...} a lubovolnú skupinu indexov i^} C {1, 2,...} platí \j=i / i=i Náhodné javy Ai,A2,... G A sú po dvoch nezávislé, ak každé dva sú nezávislé. Poznámka. Zrejme lubovolný jav A e A a jav istý íl sú nezávislé. Takisto lubovolný jav A e A a jav nemožný 0 sú nezávislé. Poznámka. Pozor, je rozdiel medzi disjunktnými (nezničitelnými) javmi (nemôžu naraz nastat, AOB — 0) a nezávislými javmi (tu treba pravděpodobnost). Príklad 3.3. V urne sú 4 lístky {000,110,101, 011}. Náhodné javy Ai — {náhodne vytiahnutý lístok má na z—tom mieste 1}, i — 1, 2, 3, sú po dvoch nezávislé, ale nie sú (združené) nezávislé, lebo p(AX) = p(A2) = p(A3) = i p(Aľ n A2) = p(Aľ n A3) = p(A2 n A3) = i p(Aí n A2 n A3) = 0. Veta 3.6. Nech A\, A2,An G A sú združené nezávislé javy. Platí (i) lubovolná postupnost Ai,A2,An, kde Áfc — Ak alebo Áfc = Ak je postupnost združené nezávislých javov; (íí) p (ULi ^) = 1 - nLi (i - p(Ak)). Dôkaz: (i) Ak Ai,A2 sú nezávislé, tak n A2) = - (Ai n A2)) = - n A2) = 14 = P(A{) - P{A1)P{A2) = P(A{)(1 - P{A2)) = P{A{)P{A2), teda Ai,A2 sú nezávislé. Tak isto P{AX n A2) = U A2)) = 1 - U A2) = 1 - P(Ai) - P{A2) + n A2) = = 1 - P(A{) - P(A2) + P(A1)P(A2) = (1 - P(A!))(1 - P(A2)) = P(A^)P(A^), čiže aj Ai a A2 sú nezávislé. Dôkaz dokončíme indukciou (pozri Riečan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972, alebo Dupač, Hušková, Pravděpodobnost a matematická statistika), (ii) Z de Morganových pravidiel a z (i) l-p(\jAk)=p(\jAk)=p(r)Ak) = l[(l-P(Ak)). * Vfe=l Vfe=l fe=i Veta 3.7. (Borelova lema) Nech Ai, A2,... e A je postupnost nezávislých javov, t.j. . Potom P (lim sup An) = 0 V 1 podia toho, či rad J^^Li P{An) konverguje alebo diverguje. Dôkaz: Ak ^2^=1P(An) < oo =4> P(limsupn^oc An) — 0 podlá Borelovej-Cantelliho lemy (Ai ani nemusia byt nezávislé). Ak Eľ=i p(An) = oo, tak P(limsuP)WOO An) = P (H~ ! Uľ=„ 40 = P (Ílľ=i 5„) = (kde fln = Uľ=n^2fln+i) = (Veta 2.2. (3)) lim,^ P(P„) = (Bn — An U (A„ U An+i) U (An U An+i U An+2) U ...) lim JV- P(Uk=nÄ = (Veta 2.2. (2)) lim = (de Morgan) lim^oo linijy^oo P (flfcLn ^fe = lim„^oo limAr^oo (nezávislost) 1 — linin^oo limj\ Uk=nP(Äk) oo linijv^oo nf=„(l - P(Ak)) > 1 - lim™ lim^ e- = 1 - lim„_ (lebo 0 < P(Ak) = xfc < 1 a 1 - xk < e~x", teda TlLjl - *fc) < Tlf=„ e"3*, čiže nf=„(i-^)>-mv=„e-- =-z:íL„-p(^) Pretože YľŽĹi P{An) — oo, čiže limjv^oo J2n=i P(An) — oo a aj linijv^oo ^}2n=k P(An) — oo pre každé n. Teda lim„^oo limAr^oo X)n=fc P(An) =ooa lim„^oo linijv^oo e- 53™=*= _ Dostávame P(limsupn_>00 A„) = 1. £ 15 4. Náhodná veličina Snažíme sa výsledok pokusu vyjadriť číslom (počet padnutých šestiek na 10 kockách; doba po ktorú svieti žiarovka; počet baktérií v jednotkovom objeme vody; atd.). Snažíme sa "pretransformovať' výsledok pokusu, náhodné javy na číselnú os. Pravdepodobnostný priestor "zobrazit" na číselnú os tak, aby sa dala spočítat pravděpodobnost všetkým "rozumným" množinám reálnych čísel. Teda chceme nájsť vhodné zobrazenie (Q, A, P) ->R pričom přepokládáme, že (íl, A, P) máme dané, určené napr. verbálne (slovne). Ukazuje sa rozumné vziať na reálnej osi borelovskú a—algebru B a hladat vhodné zobrazenie X: (íl, A) ^ (R, B) tak, aby sme mohli spočítat (udat) pravděpodobnost každej borelovskej množiny B g B. Zadefinujme si takúto "vhodnú" funkciu. Definícia 4.1. Majme daný pravdepodobnostný priestor (íl, A, P). Reálnu funkciu X definovanú na íl pre ktorú platí (4.1) VBe8^{we!l: X(uj)eB}eA nazývame náhodná veličina. Náhodnú veličinu niekedy voláme aj náhodná premenná. Funkciu X splňujúcu (4.1) nazývame meratelná funkcia, prvky c—algebry B meratelné množiny. Množinu {lú g íl : X(lS) g B} zapisujeme (skrátene) {X g B} alebo {X~ľ(B)}. Je zrejmé, že náhodnou veličinou X zobrazíme elemenárny výsledok pokusu lú na reálne číslo. Ked sa zrealizuje elemenárny jav lú, tak realizácia náhodnej veličiny je (reálne číslo) x — X(lS). Ked máme zadanú (určenú) náhodnú veličinu X, tak pre každú borelovskú množinu B g B vieme určit {lú g íl : X(lú) g B} — {X~x(B)}, špeciálne pre každé reálne číslo x je {lú g íl : X(lú) g (-oo,x)} — {X < x} g A. Poznámka. Dá sa ukázat, že k tomu, aby X bola náhodná veličina je nutné a stačí, aby Vx g R {X < x} g A. Ked máme daný pravdepodobnostný priestor (íl, A, P) (matematicky popísaný náhodný pokus) a náhodnú veličinu X (t.j. reálnu funkciu s vlastnosťou (4.1)), tak každej borelovskej (meratelnej) množine B vieme přiřadit (určit) pravděpodobnost predpisom PX(B) = P{lú g íl : X(lú) g B} = P^X^ÍB)}). Definícia 4.2. Množinová funkcia (4.2) Px(B) = P({X-1(B)}), B e B sa nazýva rozdelenie pravdepodobnosti náhodnej veličiny X. Rozdelenie pravdepodobnosti náhodnej veličiny X je teda pravdepodobnostná miera (pravděpodobnost) na cr—algebře B borelovských množín indukovaná náhodnou veličinou X. Přesvědčte sa, že naozaj Px spĺňa všetky tri vlastnosti z Definície 1.5. 16 Poznámka. Pri náhodnom pokuse - hode kockou náhodnú veličinu fyzicky zrealizujeme tak, že na jednotlivé steny kocky nakreslíme bodky. Môžeme na jednotlivé steny kocky aj napísat (nejaké konkrétne) čisla. Ak sme každej stene kocky priradili určité čislo, zostrojili sme istú náhodnú veličinu. Iný přiklad na náhodnú veličinu je merací prístroj (napríklad voltmeter). Určitému napätiu v sieti priradí číslo - hodnotu napätia. V reálnej elektrickej sieti aj konštantné napätie nie je "pevné", ale fluktuuje (vplyvom náhodných porúch). Náhodná veličina teda je pevne daná funkcia, ktorá ale svoje hodnoty nadobúda "náhodne". Pravděpodobnostně správanie sa náhodnej veličiny X, teda rozdelenie pravdepodobnosti náhodnej veličiny X je určené systémom pravdepodobností P({X Fx(a). (ii) Pre lubovolné (ale pevné) x nech {xí}°^=1 je akákolvek neklesajúca postupnost taká, že konverguje zlava k x (teda xn —>• x~). Nech Ai — {lú : X(lS) < Xi} a A — {lú : X(lú) < x}. Zrejme (JSi -A — A Ai C. A+i-Zo spojitosti zdola pravdepodobnosti dostávame Fx(x) = P(A) = P f M Ai) = lim P(Ai) = lim Fx(Xi). \i=l / (iii) Vezmime lubovolnú nerastúcu postupnost {xi}c*L1 takú, že xn —> — oo. Pri označení Bn, An z (ii) tentokrát A 2 A+i a HSi A; — 0- Preto lim Fx(xn) = lim P(An) = P( lim An) = P(0) = 0. 17 Ak teraz vezmeme lubovolnú neklesajúcu {xí}°^1 takú, že xn —> oo. Pri označení An z (ii) je Ai C Ai+i a lim Fx(in) = lim P(A„) = P ( M An ) = P(íí) = 1. * \n=l / Veta 4.2. Pre distribučnú funkciu Fx platí (4.3) P({V = x}) = Px(a; + 0)-Px(a:), x G R. (Fx(x + 0) = lmiy^x+ Fx(y) (limita sprava).) Dôkaz: Platí {X < x} — {X — x} U {X < x} a ak vezmeme lubovolnú nerastúcu {xi}c*Ĺ1 takú, že xn —> x+, tak {X < x} — n^Li{V < Xn}, pričom {X < xn} D {X < xn+i\. Zo spojitosti pravdepodobnosti zhora platí P({X < x}) = P ( f) {X < xn}) = lim P({X < xn}) = \n=l / = lim F(xn) = Fx(x + 0), (pričom zo spojitosti pravdepodobnosti zhora vyplýva, že linin^oo P({X < xn}) existuje a je jediná pre akúkolvek nerastúcu postupnost {xí}°^=1 takú, +). Preto P({X = x}) = P({X < x}) - P({X < x}) = Px(x + 0) - Fx(x). * Dôsledok. Fx(-) je spojitá v x práve vtedy ak P({X — x}) — 0 (lebo Fx(-) je zlava spojitá vždy a sprava práve ak P({X — x}) — 0). Veta 4.3. Distribučná funkcia má najviac spočitatelne vela bodov nespojitosti (skokov). Dôkaz: Označme Cn — { množina bodov, v ktorých má Fx(-) skok väčší ako ^ }. Velkost skoku v bode x je vlastne (podlá (4.3)) Fx(x + 0) - Fx(x) — P{{X — x}) a Cn — {x e R : P{{X — x}) > i}. Pretože hodnoty pravdepodobnosti ležia v intervale < 0,1 >, môže mat Cn najviac (n—1) prvkov. Množina bodov oo C — {x : Fx(-) má v bode x nejaký skok} — Cn. n=2 Pretože C je spočitatelným zjednotením konečných množín, je nanajvýš spočitatelná. ♦ 18 Lebesgueova - Stieltjesova miera Stručne si povieme o Lebesgueovej - Stieltjesovej miere. Majme danú reálnu funkciu F s vlastnostami (i) neklesajúca (ii) spojitá zlava. Majme systém S všekých intervalov tvaru < a, b), kde a < b. Potom je množinová funkcia /i definovaná na S predpisom /i(< a, b)) — F (b) — F (a) a—aditívna, (dôkaz pozri napr. Riečan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972, Veta 5.2.1). Z teórie miery potom existuje práve jedna miera /xp definovaná na systéme B všetkých borelovských množín taka, že /xp(< a, b)) — F (b)—F (a) (dôkaz pozri napr. Riečan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972, Veta 5.2.2). Miera lif sa nazýva Lebesgueova - Stieltjesova miera indukovaná funkciou F. Dá sa ukázat, že ak navyše platí, že lim2,^_00 F (x) — 0, lim^^oo F (x) — 1, tak lá, p je pravděpodobnost na (R, B). Poznamenávame len, že ak za funkciu F(-) zvolíme funkciu F (x) — x, tak lá, p sa volá Lebesgueova miera. Poznámka. Lebesgueova-Stieltjesova miera sa zavádza všeobecnejšie pre funkcie F ktoré sú neklesajúce a spojité zlava (nemusia byt len distribučné funkcie). Pre nás je dôležitý prípad ked F je distribučná funkcia. Poznámka. Ak máme náhodnú veličinu X a jej distribučnú funkciu Fx, tak na systéme S intervalov < a, b), kde a < b je Px(< a,b)) = P({a < X < b}) = Fx(b) - Fx(a) = hfx(< a, b)) a preto pravdepodobnostná miera lá,p je totožná s rozdelením pravdepodobnosti Px (podrobnejšie pozri napr. v Riečan, B., O pravdepodobnosti a miere, Alfa, Bratislava, 1972). Z teórie integrálu pre každú B e B ^ ľ PX(B) — fj,px(B) — / dnFx(x) (Lebesgueov-Stieltjesov integrál) — J B — j dfj,px — / dFx(x) (iné značenie). J B J B Platí aj nasledujúca veta ("opak" Vety 4.1): Veta 4.4. Nech F je neklesajúca, spojitá zlava a linia^-oo F (x) — 0, linia^oo F (x) — 1. Potom existuje náhodná veličina X tak, že F je jej distribučná funkcia. Dôkaz: Povedali sme, že lá,p je pravděpodobnost na (R, B) a preto (R, B, lá,p) je pravdepodobnostný priestor. Definujme teraz na R náhodnú veličinu X vztahom X {x) — x. Je zrejmé, že X je náhodná veličina, lebo ak B G B, tak X^1(B) — B je borelovská množina. Nech G je distribučná funkcia náhodnej veličiny X, potom oo G (x) — /ij?({X_:L((—oo, x))) — np((—oo,x)) — ij,p(\^J < x — n,x)) — n=l — lim ixp(< x — n, x)) — lim (F (x) — F(x — n)) — F (x) — lim F(x — n) — F (x). Teda F je distribučná funkcia náhodnej veličiny X. £ 19 5. Diskrétne náhodné veličiny (náhodné veličiny diskrétneho typu) Náhodným veličinám zodpovedajú určité distribučné funkcie (teda aj určité Lebesgueove-Stieltjesove miery). Definícia 5.1. Nech {pi}fZi je rad kladných čísel takých, že YIíĹiPí — í a. M — {xí}°11 je (lubovolná) postupnost rôznych reálnych čísel. Funkcia (xi,Pi)fZi na {xí}í^=i sa nazýva pravdepodohnostná funkcia. Poznamenajme len, že postupnosti {xí} a {pi} môžu byt aj konečné. Poznámka Pravdepodobnostná funkcia môže byt chápaná aj ako (xi,pi)iej, kde J je konečná alebo spočitatelná indexová množina. Veta 5.1. Nech (xí,Pí)(^L1 je pravdepodobnostná funkcia. Položme F (x) = Pi- Xi 0, teda F (y) > F (x). Nech je x pevné číslo. Nech e je lubovolné kladné číslo. Pretože YľiLiPi — 1; existuje také n, že ^2°ZnPi < e. Vezmeme ô > 0 tak, aby sa v (x — ô,x) nenachádzalo žiadne z čísel x±, ...,xn-±. Potom pre y G (x — ô, x > je oo F(x)-F(y)= Y, P.<& m0 je zm < zmo). Preto Vra > m0 je 0 < F(zm) < F(zmo) = E{a; • a; i konverguje {ŕXzm)}m>i k nule. Nech {zn}^=1 je (lubovolná) taká rastúca postupnost, že lim„^oo zn — oo. Označme cardjaľi : xí < zn} = jn- Zrejme lim^oo jn = oo. Pretože YhĹiPí = 1; Platí lim F(zn) — lim > Pi = lim > Pi — 1. ♦ ^'i<^ti i—1 Pretože F z predchádzajúcej vety je distribučná funkcia, existuje náhodná veličina, ktorá má túto distribučnú funkciu. Takúto náhodnú veličinu nazývame diskrétna náhodná veličina alebo náhodná veličina diskrétneho typu. Pre rozdelenie pravdepodobnosti diskrétnej náhodnej veličiny s pravdepodobnostnou funkciou (xi,pi)°^=1 platí (5.1) Px(B) = xteB Táto náhodná veličina nadobúda s nenulovými pravděpodobnostem! práve tie reálne hodnoty xí, pre ktoré je pi > 0, pritom pre tieto hodnoty je P({X — x i}) — pi a pre lubovolné x ^ {x\, x2, ■■■} je P({X — x}) — 0. Samozrejme platí pre lubovolné x e R, že P({X — x}) — F (x + 0) — F (x). 20 Predchádzajúce úvahy majú aj takú interpretáciu, že ak máme reálnu funkciu X, ktorá nadobúda hodnoty z množiny M — {x\, x2, ■■■} s pravděpodobnostem! P({X — Xi}) — pi, pričom pi > 0, i — 1,2,... a ^2°ZiPí ~ 1' tak X je náhodná premenná s rozdelením pravdepodobnosti (5.1). Príklady diskrétnych náhodných veličín Náhodná veličina s alternatívnym rozdelením pravdepodobnosti (Alternatívne rozdelenie pravdepodobnosti) Majme M — {0,1}, (teda xi — 0, x2 — 1) a ďalej pi — í — 6, p2 — 6, pričom 6 e< 0,1 >. Nazveme 0— neúspech a 1—úspech. Potom funkcia X (schválne nehovoríme kde je definovaná), ktorá nadobúda hodnoty 0 a 1 s pravdepodobnostami P(X — 0) — 1 — 6 a P(X — 1) — 6 je náhodná premenná. Rozdelenie pravdepodobnosti tejto náhodnej premennej sa nazýva alternatívne rozdelenie pravdepodobnosti s parametrom 6 a píšeme X ~ A(6). Modelujeme (matematicky popisujeme) ním situáciu, ked máme pokus s dvomi možnými výsledkami - "úspechom" a "neúspechom". Pravděpodobnost úspechu je ŕ? a neúspechu 1 — 6. Jej distribučná funkcia je Ľahko skonštruujeme v tomto prípade priestor elementárnych javov íl — {uji, uj2} a u—algebru náhodných javov A = {{0}, {cji}, {uj2}, fl}. Pravděpodobnost P({0}) — 0, P({lji}) = 1 — 6, P({lj2}) — 6, P (íl}) — 1. Náhodná veličina X je definovaná nasledovne: X(wi)=0, X(w2) = l. 21 Pravda, toto všetko už "nepotrebujeme". Stačí nám poznat pravděpodobnostmi funkciu náhodnej veličiny X. Binomické rozdelenie pravdepodobnosti Majme M — {0,1, 2,n} (teda x\ — 0, x2 — 1,xn+i — n) a px+i — p(%) — ^ ^ ŕ?^-(1 — 9)n~x > 0 pre x — 0,1, 2,n, # G< 0,1 >. Zrejme Ž> = £ Lr (1 ~e)n~x = [9+{1-0)]n = L j=l a;=0 ^ ' Náhodná veličina X, ktorá nadobúda hodnoty {0,1, ...,n} s pravděpodobnostem! P (X — x) — ^ ^0^(1 — 6)n~x, x = 0,1,..., n má binomické rozdelenie pravdepodobnosti s parametrami n, ŕ?. Označujeme X ~ Bi(n,0). Ak uvažujeme experiment, ktorý pozostáva z n nezávislých alternatívnych pokusov, v ktorých nás zaujíma len nastatie alebo nenastatie náhodného javu A (pravděpodobnost nastatia javu A v jednotlivom alternatívnom pokuse je(9G<0,l>), potom X — počet nastání náhodného javu A v experimente je x x — 0,1, 2..., n, je diskrétna náhodná veličina a X ~ Bi(n, 6). Dokážte to ako cvičenie. Poissonovo rozdelenie pravdepodobnosti \x Majme M — {0,1,2,} a px+1 — p(x) — e~A— > 0 pre x — 0,1,2,9 > 0. Zrejme x\ oo oo .j, oo xx & = £e-A^ = e-A£^T = e-AeA = l. j=l a;=0 ' a;=0 A11 Náhodná veličina X, ktorá nadobúda hodnoty {0,1,...} s pravděpodobnostem! P(X x\ 0,1,..., má Poissonovo rozdelenie pravdepodobnosti s parametrom A. Označujeme X ~ Po(A). Takáto náhodná veličina popisuje napríklad výskyt "riedkych javov", počet organizmov v jednotke pôdy, počet listov na strome, počet havárií, počet prerušení výroby, počet hovorov v telefónnej sieti, atd. Veta 5.1. (Poissonova) Ak Xn ~ Bi(n,p„), kde linin^oo npn — A > 0, pn G (0, í) a. X ~Po(A), tak pre k — 0,1, 2,... platí lim P({Xn = k})=P({X = k}). n—>oo Dôkaz: Pre k — 0,1, 2,... platí lim P({Xn = k})= hm (f)í£(l-p„)n-fc = 1 npn(n-ľ)pn...(n-k + ľ)pn n Afe _A ~ -ň-u-(l-Pn) =-rje ' n->oo fe! (1 — p„J K! lebo 22 Negatívne binomické rozdelenie pravdepodobnosti a geometrické rozdelenie pravdepodobnosti MajmeM = {0,l,2,...,}aPa:+i=p(a;)= 1 )pr(l-p)x = Náhodná veličina X, ktorá nadobúda hodnoty {0,1,...} s pravdepodobnosťami P(X — x) — í )pr(l p)x, x — 0,1,..., má negatívne binomické rozdelenie pravdepodobnosti s parametrami r,p. Označujeme X ~ NeBi(r,p). Ak uvažujeme experiment, ktorý pozostáva z nezávislých alternatívnych pokusov, v ktorých nás zaujíma len nastatie alebo nenastatie náhodného javu A—úspech (pravdepodobnosť nastatia úspechu v jednotlivom alternatívnom pokuse je p G (0,1)), potom je diskrétna náhodná veličina aX~ NeBi(r,p) s hodnotami x — 0,1, 2,. Dokážte to ako cvičenie. Špeciálnym prípadom negatívneho binomického rozdelenia pre r — 1 je geometrické rozdelenie pravdepodobnosti. Náhodná veličina X, ktorá nadobúda hodnoty {0,1,...} s pravdepodobnosťami P (X — x) — p(\—p)x, x — 0,1,p G (0,1), má geometrické rozdelenie pravdepodobnosti s parametrom p. Označujeme X ~ Ge(p). Ak uvažujeme experiment, ktorý pozostáva z nezávislých alternatívnych pokusov, v ktorých nás zaujíma len nastatie alebo nenastatie náhodného javu A—úspech (pravdepodobnosť nastatia úspechu v jednotlivom alternatívnom pokuse je p G (0,1)), potom je diskrétna náhodná veličina, X ~ Ge(p) s hodnotami x — 0,1, 2,... . Hypergeometrické rozdelenie pravdepodobnosti Majme N G N, (N > 2) súčiastok, z ktorých je A G N chybných, pričom N > A. Zo všetkých N súčiastok náhodne vyberieme n G N súčiastok (bez vrátenia), pričom n < N. Náhodná premenná má hypergeometrické rozdelenie pravdepodobnosti s parametrami N, A, n. Označujeme to X ~ Hg(N, A, n). Samozrejme musíme sa presvedčiť, že takto popísaná funkcia X je skutočne náhodná premenná a definovať hypergeometrické rozdelenie pravdepodobnosti. X — počet neúspechov, ktoré predchádzajú r—tému úspechu X — počet neúspechov pred prvým úspechom X počet chybných súčiastok medzi n vytiahnutými 23 Najprv si uvedomme, že môžu nastat práve 4 prípady, a síce (i) n < A, n < N — A (počet dobrých súčiastok) vtedy X nadobúda hodnoty x G {0,1,n} (ii) n < A, n > N — A vtedy X nadobúda hodnoty x G {n — (N — A) — n — N + A (najmenej chybných),n — N + A + l,...,n (najviac chybných) } (iii) n > A, n < N — A vtedy X nadobúda hodnoty x G {0,1,A} (iv) n>A, n>N-A vtedy X nadobúda hodnoty x G {n - N + A, n - N + A + 1,A} Teda x— počet chybných súčiastok medzi n vytiahnutými je z intervalu < k\,k2 >, kde k\ — max(0, n — N + vo vybratej n—tici) je x chybných ( ^ spôsobmi a ku každému spôsobu je ^ ^ možností vybratia A\ ŕ N - A x j V n — x bezchybných, teda (5.2) P({X=x}) x G< max(0,n — N + A),min (A,n) >. Dôkaz toho, že (5.2) je rozdelenie pravdepodobnosti vyplýva z identity 't' och: ktorú dokážeme pomocou nasledujúcej lemy. Najprv si ale zadefinujeme klesajúci faktoriál reálneho čísla x. Ak k G Nq, x G R, tak klesajúci faktoriál x^ = 0a pre k G N je x^) — x(x—l)...(x — k+l). Teraz kombinačné číslo môžeme písat ako ^ a "rozšírili" sme pojem kombinačného čísla ) tak, že namiesto n G N0 môžeme uvažovat n G R (samozrejme k G No zostáva v platnosti). Lema 5.1 Pre lubovolné reálne čísla x, y a n G N0 platí (5-4) E fe=0 k)\n — k) \ n (Cauchyho kombinatorický vzorec). Dôkaz: 1. Pre n — 0 je identita zrejmá. 2. Nech teda platí pre nejaké n G N a dokážeme, že n+l (5-5) E ^ W y i (x + y k=0 k/\n + l — kj Vn+l Vieme, že pre lubovolné a G R, n G Nq je a \ a — n f a\ fx + y\ x + y — nfx + y teda + 1/ n + \n + 1/ n+l \ n preto počítajme x + y — n ^ / y \ 1 V^r níx\í V ____ . .. . _ ____ v/í /•• fe=0 v 7 v 7 fe=0 25 6. Spojité náhodné veličiny (náhodné veličiny (absolútne) spojitého typu) Najprv si zopakujeme určité tvrdenia z matematickej analýzy týkajúce sa absolútne spojitej funkcie. Definícia 6.1. Funkcia F(-) je absolútne spojitá (na R), ak k lubovolnému e > 0 existuje také S > 0, že pre každú postupnost a\ < bi < a2 < b2 < ... < an < bn takú že X)ľ=i(^ — aj) < ô platí X)ľ=i l-^XM-F(ai)\ < e- Vlastnosti absolútne spojitej funkcie: (i) Ak je F absolútne spojitá, tak je spojitá. (ii) Ak je F absolútne spojitá, tak má skoro všade (vzhladom na Lebesgueovu mieru) vlastnú deriváciu. Táto derivácia je integrovatelná v Lebesgueovom zmysle a platí F (x) = F'(i)dt + F (a) pre každé a G R. (iii) Ak je F absolútne spojitá a platí F'(x) — 0 skoro všade (vzhladom na Lebesgueovu mieru), potom je F konštantná skoro všade (vzhladom na Lebesgueovu mieru). (iv) Ak je F neurčitým integrálom funkcie / (v Lebesgueovom zmysle, teda F (x) — J f(x)dx), potom je F absolútne spojitá a platí F'(x) — f (x) skoro všade (vzhladom na Lebesgueovu mieru). (v) Ak je F absolútne spojitá, tak má na každom konečnom intervale < a, b > konečnú variáciu, t.j. sup J^Lj \F(xj) — F(xj-i)\ < oo, pričom supremum sa berie cez všetky N a konečné postupnosti a — xq < x\ < ... < aľjv — b. Teraz si zadefinujeme absolútne spojitú náhodnú veličinu. Definícia 6.2. Povieme, že náhodná veličina X definovaná na (Í2, A, P) je absolútne spojitého typu (spojitá), ak existuje (nezáporná) integrovatelná funkcia /(•) taká, že pre každú borelovskú množinu B G B je PX{B) = / f(x)dx. J B Funkciu / nazývame hustotou rozdelenia pravdepodobnosti (hustotou) náhodnej veličiny X. Veta 6.1. (Vlastnosti hustoty.) Nech X je náhodná veličina absolútne spojitého typu, / je jej hustota a f1 jej distribučná funkcia. Potom (í) J-oof(X)dx= V> (ii) F{x) = £oof{ť)dt; (iii) F(-) je absolútne spojitá funkcia; (iv) hustota /(•) je určená jednoznačne skoro všade vzhladom k Lebesgueovej miere, t.j. ak / a g sú hustoty náhodnej veličiny X, tak /i({x : f (x) ^ g(x)}) — 0, kde /i je Lebesgueova miera; (v) existuje F'(x) skoro všade vzhladom k Lebesgueovej miere /j, a funkcia g (x) — F'(x) je hustota náhodnej veličiny X; (vi) pre a < b platí F (b) - F (o) = fa f(x)dx a tiež P({a < X < b}) — P({a < X < b}) — P({a < X < b}) = P({a 0 pre každé x G R skoro všade vzhladom k Lebesgueovej miere. Dôkaz: 26 (i) Ak má X hustotu /, tak z definície aboslútne spojitej náhodnej veličiny vyplýva, že v B G B P x {B) — Jb f(x)dx. Ak vezmeme B — R, tak 1 — Px({R}) — JR f(x)dx — J^° f(x)dx. (ii) Vieme, že F (x) = P{{X < x}) = Px((-oo,x)) = f(t)dt. (iii) Tvrdenie z matematickej analýzy: Ak pre funkciu F platí F (x) — J^^ f{ť)dt pre každé x G R, tak f1 je absolútne spojitá na R. (iv) Ak / a g sú hustoty náhodnej veličiny X, tak pre každú B G B platí Px(B) — JB f(x)dx — JB g(x)dx. Z toho dostávame, že pre každú B G B platí JB{.f{x) — g(x))dx — 0, čiže /z({x : /(x) 7^ g(aľ)}) = 0. (v) Tvrdenie je dôsledkom absolútnej spojitosti ((ii) vlastnost absolútne spojitej funkcie). (vi) Podia Vety 4.1., Vety 6.1. (ii) a aditívnej vlastnosti integrálu platí P({a < X < b}) — F (b) — F (a) — I-00 f(J)dt ~~1-00 /(*)^ ~ Ja f(J)dt- Distribučná funkcia F je absolútne spojitá, preto je spojitá a pre každé x G R podlá (4.3) platí P (X — x) — 0, z čoho lahko dostaneme ostatné vztahy. (vii) Ak napíšeme pre lubovolné /i>0ai také, že existuje F' {x) — f (x) *P = f«»-*^<»+»>> - m, tak platí lim^o ^ = lim^0 *■(*+»>/(*-*> **~o fí*) = /(*) f (x) = 0. (viii) Funkcia / je nezáporná, lebo distribučná funkcia F je neklesajúca - dôkaz v matematickej analýze. Predstavu o hustote dá nasledujúci vztah í + f(t)dt = f(x)Ax, J x alebo aj P{x < X < x + dx) = f{x)dx. Príklady (absolútne) spojitých náhodných veličín Náhodná veličina s rovnomerným rozdelením Náhodná veličina X má rovnomerné rozdelenie pravdepodobnosti na intervale (a, b) (pričom —00 < a < b < 00), ak jej hustota je , 1 ak a < x < b ak x (É (a, b). Značíme X ~ Ro(a, b). Distribučná funkcia X je 0, ak x < a x — a F (x) — l--, ak a < x < b b — a 1, ak x > b. Interpretácia takejto náhodnej veličiny je názorná: Istota (jednotková pravděpodobnost) je na intervale (a, b) rovnomerne " rozprestrená". 27 Náhodná veličina s exponenciálnym rozdelením Nech náhodný jav A sa vyskytuje v náhodných okamžikoch (napr. prerušenie výroby, vyhorenie žiarovky, prelet častice, atd.) Výskyty tohto náhodného javu A v neprekrývajúcich sa časových intervaloch sú nezávislé. Označme Q (t) - pravděpodobnost, že sledovaný jav A nenastane v priebehu časového intervalu dĺžky t Ak íi,Í2 sú dĺžky dvoch na seba nadväzujúcich časových intervalov, tak Q(ti+h) = Q(íi)Q(í2) P {A nenastane v priebehu času t\ a súčasne nenastane v priebehu času í2}. Nech Q je diferencovatelná funkcia času a pre t — 0 nadobúda maximum, teda Q(0) — 1. Pre t > 0, Aí > 0 je lnQ(í +Aí) = In Q (í) + lnQ(Aí), čiže pre t > 0 je hm hQ(' + A*)-lnQ(*)= lnQ(Aí) = v w; At^0+ Aí At^0+ Aí ľ lnQ(0 + Aŕ)-lnQ(0) (ide o deriváciu sprava, ktorú označíme —A, pričom A > 0). Máme teda diferenciálnu rovnicu s počiatočnou podmienkou dlnQ(í) _ . -;- — —A dt Q(0) = 1. Jej riešenie je Q (ť) — eTxt. Označme X - náhodnú veličinu - čas, ked nastane prvýkrát sledovaný jav Zrejme Fx(t) = P({X < t}) = P(jav A nastane v čase (0, í)) = 1 - Q (t) (tuná Q (t) je pravděpodobnost, že sledovaný jav nenastane v intervale (0,í)), teda .l-e-x\ akí>0 Fx(t) 0, ak t < 0. Náhodná veličina X má exponenciálne rozdelenie pravdepodobnosti s parametrom A a označujeme X ex(A). Jej hustota je í\e-xt, akí>0 fx(t)={ [0, akí<0 (dostaneme derivovaním F). 28 Náhodná veličina s normálnym rozdelením (normálna náhodná veličina, gaussovská náhodná veličina) Ak má náhodná veličina X hustotu (x - m)2 f (x) = -=^e 2a \/2ir u [i G (—00, 00), cr2 > 0, tak povieme, že X má normálne (Gaussovo, gaussovské) rozdelenie pravdepodobnosti s parametrami \x, a2 a píšeme X ~ iV(/i, c2). V prípade /i — 0 a u — í ide o štandardizovanú normálnu náhodnú veličinu, čo označujeme X ~ -/V(0,1). Jej hustota je "*> = ;7Er^ Normálne rozdelenie má náhodná veličina, ktorá vznikla súčtom velkého počtu nezávislých náhodných veličín (o rozdelenia ktorých stači předpokládat určité velmi všeobecné predpoklady). Normálne rozdelenie má velmi dôležitú úlohu v teórii pravdepodobnosti a matematickej štatistike. Napríklad normálne rozdelená je náhodná chyba meracieho prístroja, chyba pri streľbe na ciel, telesná výška jedincov homogénnej populácie, atd. Poznamenávame len, že skutočnosť, že f (x) je hustota vyplýva z rovnosti J0°° e~a x dx — a > 0. Náhodná veličina s gama rozdelením Ak má náhodná veličina X hustotu ÍT^-V>-\ akx>0 I 0, ak x < 0 a > 0, p > 0, tak povieme, že X má gama rozdelenie pravdepodobnosti s parametrami a, p lo Gama funkcia T (a) je definovaná predpisom T (a) — J0°° xa 1e xdx, a > 0. Jej najčastejšie používané vlastnosti sú T (a + 1) = aT(a), T(i) = y/ň, T (n) = (n - 1)! pre n e N. 5. Náhodná veličina s beta rozdelením Ak má náhodná veličina X hustotu í-Řr-i^xa-1(l-x)b-1, ak0<2ľ 0, b > 0, tak povieme, že X má beta rozdelenie pravdepodobnosti s parametrami a, b. Beta funkcia B(a, b) je definovaná predpisom B(a, b) — xa_1(l — x)b~1dx, a > 0, b > 0. Vzťah medzi r(a)r(6) beta funkciou je vyjadrený nasledovne: B (a, b) T(a + b) 29 Poznámka o distribučných funkciách Diskrétne a spojité náhodné veličiny (resp. distribučné funkcie diskrétnych a spojitých náhodných veličín) predstavujú dve prakticky velmi dôležité triedy. Vo všeobecnosti ale o distribučných funkciách platí veta (nebudeme ju dokazovat, pozri napr. Rudin, W., Analýza v reálném a komplexním oboru, Academia, Praha, 1977) Veta 6.2. Nech X je náhodná veličina s distribučnou funkciou F. Potom F sa dá napísat v tvare F (x) — a\Fa(x) + a2Fa(x) + a3Fs(x) «i,«2,«3 > 0,ai + a,2 + a-i — 1, pričom Fa(-) je distribučná funkcia diskrétnej náhodnej veličiny, Fa(-) je distribučná funkcia absolútne spojitej náhodnej veličiny a Fs(-) je distribučná funkcia singulárně spojitej náhodnej veličiny. Povieme, že F je singulárně spojitá, ak je spojitá a pritom existuje borelovská množina B Lebesgueovej miery 0 a /xp miery 1. Takáto funkcia má skoro všade (vzhladom na Lebesgueovu mieru) deriváciu rovnú 0 a je spojitá v R. Napríklad Cantorova funkcia je spojitá, diferencovatelná, rastúca, deriváciu má nulovú s výnimkou množiny Lebesgueovej miery 0. Takáto funkcia funkcia je spojitá a nie je absolútne spojitá. 30 7. Náhodné vektory Máme často nielen jednu náhodnú veličinu, ale súčasne niekolko náhodných veličín. Zaujíma nás, či niektoré z nich spolu "akosi" súvisia, či (známe) hodnoty jednej náhodnej veličiny (resp. určitej skupiny náhodných veličín) vedia niečo povedat o hodnote inej náhodnej veličiny (iných náhodných veličín). Snažíme sa vyšetřovat (aj) závislosť. Potrebujeme model, v ktorom pracujeme s niekoľkými náhodnými veličinami súčasne. Zopakujme si: (íl, A, P) je pravdepodobnostný priestor X : íl ->• R, pre ktorú platí x e R =4> {lo G íl : X(lo) < x} G A je náhodná veličina. Rozšírme na mnohorozmerný prípad: (íl, A, P) je pravdepodobnostný priestor x2(-) X íl R™, \Xn(-)J a označme [X < x] = {lú G íl : Xi(w) < xx, ...,Xn(bj) < xn}. Bn nech je najmenšia c—algebra nad intervalmi tvaru (—00, Xi) x (—oo,2ľ2) x ... x (—00, xn) pre ľubovolné x G R™ (t.j. x — (x\,xn)'). Nazývame ju borelovská c—algebra v R™. Definícia 7.1. Majme pravdepodobnostný priestor (íl, A, P). Reálna vektorová funkcia X(-) definovaná na íl s hodnotami v R™, pre ktorú platí x£R"^[X 0. dalej označme rekurentně A«A«P(x1,...,x„) = A«[A«P(x1,...,x„)] = — F(^X\^..., x i -\- hi, ..., x j -\- h j, ..., Xji^ F(^X\^..., x j -\- h j,..., x^) 31 [F(xi 7 • • -7 X i kli ■■ ■ > Xn) F(x\7 •••7 Xn)\ — ^ht ^hj ^(.^17 •• -7 Xn) • Vlastnosti distribučnej funkcie popisuje nasledujúca veta Veta 7.1. Distribučná funkcia Fx n—rozmerného náhodného vektora má tieto vlastnosti: (i) lim^-^oo, i<4<„ Fx(xi, xn) = 1, (ii) pre « = 1,2, ...,n je lim^-^-oo Fx(xi, ...,xn) = 0, Vxi, ...,xl^1,xl+1, ...xn, (iii) Fx je spojitá zlava v každej premennej, (iv) pre lubovolné reálne lubovolné hk > 0, (k — 1, 2,n) platí A^A^La^^i, *„) > 0. Dôkaz nájdeme napr. v (Dupač, V., Hušková, M., Pravděpodobnost a matematická statistika, Karolinum, Praha, 2001 alebo Rényi, A., Teorie pravděpodobnosti, Academia, Praha, 1972). Poznámka. Platí A^'A^La^^, ...,xn) = P {J]{x, 0, x2 > 0, x\ + x2 > 1 a F(x\, x2) — 0 inak, potom F(x\, x2) je neklesajúca v každej premennej a }F(0, 0) = a^ [F(0,1) - F(0, 0)] = F(l, 1) - F(0,1) - F(l, 0) + F(0, 0) — 1 — 1 — 1 + 0 = —1, čo nemôže byt (podia predchádzajúcej poznámky) F(0 < X\ < 1, 0 < X2 < 1), čiže táto funkcia F nie je distribučnou funkciou. Analogicky ako v jednorozmernom prípade definujeme Lebesgueovu-Stieltjesovu mieru /xp indukovanú distribučnou funkciou F na borelovských množinách Bn (položíme pre n—rozmerný interval < ai,&i)x < a2,b2) x ...x < an,bn), kde a% < b%, i — 1,2,..., n, mieru (íf({< «i,&i)x < «2,^2) x ...x < an,bn)}) — a^^_ a^^_ ...A^_a F(a±,an) a jednoznačne ju rozšírime na všetky borelovské množiny v R™ tak, aby miera n—rozmerných intervalov bola zachovaná). Platí aj nasledujúca veta: Veta 7.2. Nech funkcia F(x\,xn) spĺňa podmienky (i)-(iv) Vety 7.1. Potom existuje pravdepodob-nostný priestor (íl, A, P) a n—rozmerný náhodný vektor X tak, že Fx — F. Dôkaz vety je analogický ako v jednorozmernom prípade. Definícia 7.3. Distribučná funkcia F (n premenných) sa nazýva diskrétna, ak existuje konečná alebo spočitatelná postupnost M — {xm}mej, kde J je konečná alebo spočitatelná indexová množina (pričom xm G R™ sú navzájom rôzne) a zodpovedajúca postupnost kladných čísel {pm}meJ tak, že ^2mejPm = 1 a ^Xx) — Ex • < 0, oo) taká, že /x\ i-x-2 ŕXn / ... / f(t1,...,tn)dtn...dt1 pre všetky x e R™. Funkcia / sa nazýva hustota. Poznámka. Pre hustotu platí (i) /(x) > 0 pre skoro všetky x e R™ (vzhladom na Lebesgueovu mieru), JR„ /(x)dx = 1, (ii) pre každú B e Bn platí PX(P) = /B /(x)dx, (iii) f(xi,x„) = —--—F(x\,x„), pričom derivácia existuje skoro všade vzhladom k Lebesgueovej C/ Ju \ . . . (J Ju Príklad 7.2. Náhodné vektory absolútne spojitého typu (s distribučnými funkciami absolútne spojitými). n—rozmerný rovnomerný náhodný vektor X má hustotu nľ=i ft^-' pre xie («í>a), * = 1,2, I IT™ 1 f(xi,x2, ...,xn) = 0 inak, pričom aj, /3j g R, cti < Pi, i— 1,2,..., n. Označujeme X ~ Po„(ai, /3i,a„, pn). n—rozmerný normálne rozdelený náhodný vektor X (náhodný vektor s regulárnym normálnym rozdelením) má hustotu f(x1,x2,...,xn) = /(x) =-/, e-^x-rt's-'tx-n) kde /x = (/ii,Hn)', /íí g R, z = 1, 2,n a E je pozitívne definitná matica. Značíme X ~ ./V„ (/x, S). 33 Marginálne náhodné vektory Náhodný jav [X < x] môžeme písat aj ako nľ=i[^ < xů- Ak s^ zvolíme pevné j G {1,2, ...,n}, tak pre (lubovolnú) postupnost x^ —> oo je n Ä! = f| [x i < Xl] n [xj < ij1'] a2c ... i = 1 í ¥= j a postupnost náhodných javov A±, A2,... má linin^oo An — IJfcLi ^fe ^ pričom / \ n p| [x, < x,] n [Xj < xf]] (7.1) fe=l fe=l i = 1 = f) [Xi oo kde {yi,yn-k} — {1, 2,n} — {íi,i^}. Dokázali sme vlastne tvrdenie Veta 7.3. Všetky marginálne rozdelenia pravdepodobnosti náhodného vektora X sú jednoznačne určené rozdelením pravdepodobnosti náhodného vektora X. Veta 7.4. (a) Nech (xm,pm)mej, (J je konečná alebo apočitatelná indexová množina) je pravdepodob-nostná funkcia náhodného vektora X — (X±,Xn)', pričom M — {xm — (a^m'),x£m^)'}mej. Potom marginálny náhodný vektor X* = (Xit,Xik)' má marginálnu pravdepodobnostnú funkciu (x*,p*)ses, kde pričom všetky x* sú navzájom rôzne a ,Xlk=x^}) (xmEM: a;l>)=a;l>),...,a;l>)=a;l>)} L »l »l »fc »fc ' 34 (b) Nech X je spojitý náhodný vektor s hustotou /(x). Potom marginálny náhodný vektor X* má hustotu f {xí! i xik)— / ■■■ / f{xi,...,xn)dxy1...dxynk, — OO J — OO kde {yi, ...,yn-k} = {1,2, ...,n} - {ň, ...,zfc}. Dôkaz: Dokážeme si len tvrdenie (b) (tvrdenie (a) si dokážte ako cvičenie). Platí F*(x*) = lim F{Xl,...,xn) lim oo J — oo «/ —OO /(íi, ...,tn)dti...dt„ teda — oo •J — oo OO />OG — oo —oo — oo J — oo f (ýll ■ ■ ■ 1 ^n)dty1 . ,.dtynk /OO f (tl, . . tn)dty1 .. .dtynk / (t^ , íífc). ^ -oo 8. Nezávislé náhodné veličiny Definícia 8.1. Povieme, že náhodné veličiny X\,X2,Xn sú združené nezávislé, ak pre každú n—ticu reálnych čísel x\,x2, ...,i„ platí < X1,X2 < X2, ...,Xn < Xn) = P{X1 < X1)P(X2 < X2)...P(Xn < Xn). Veta 8.1. Nech náhodný vektor X — (X\, ...,Xn) má distribučnú funkciu F (x) a nech Fx%{xi) Je distribučná funkcia marginálnej náhodnej veličiny Xi, i — 1,2,n. Potom X\,Xn sú združené nezávislé práve vtedy, ak F(x) = 11™= i Pxt(xi) pre Vx e R™. Dôkaz: Xi, ...Xn sú združené nezávislé <í=> Vx = (x!,e R™ je P (p£=1{Xi < x,}) = nľ=i ^({^i < ^» Vx = (xi, ...,x„)' e R™ je F (x) = F(xi, ...,2ľ„) = P({Vl < Xi,X2 < x2, ...,Xn < xn}) = = c — 1. J G J J o J o 36 Marginálne hustoty sú f x (x) /So fx,y(x,y)dy = dy = 1, ak x G< 0,1) inak. Analogicky f y (y) = 1, ak y G< 0,1 > 0, inak. Pretože V (x, y)' G R2 platí fx,y(x, y) — f x (x) ■ f y {y), sú X a. Y nezávislé, (b) hustota (X, Y) je c, ak (x.y) G G f x,y [x, y) = 0, inak. Teda 1 = /> 1 r r-l—X "I />1 ix,y{x, y)dxdy — c / dy dx — c I (í — x)dx — Jo Uo J ./o i x c x — = - => c = 2. 2 Marginálne hustoty sú t . , í L°°oo /*,H*> V)dy = 2 £ 35 = 2 35 = 2(1 - x), ak x G< 0,1) I 0, inak. Analogicky f y (y) 2(1-y), akyG<0,l> inak. Platí, že V (x, y)' G< 0,1)x < 0,1 > okrem {(x,y) : x G< 0, \ >, y = ^fy } je/x,y(x, y) ^ fx(x)-fY(y). Množina na ktorej fxy{x,y) ^ f x (x) ■ f y (y) je kladnej Lebesgueovej miery (nie je Lebesgueovej miery 0). Preto X a Y nie sú nezávislé. 9. Rozdelenie pravdepodobnosti transformovaných náhodných veličín Veta 9.1. Nech X je náhodná veličina a h borelovsky meratelná funkcia. Potom h(X) je náhodná veličina. Dôkaz: Nech B G B je lubovolná borelovská množina. Označme h^1(B) — {t G R : h(ť) G B}. Pretože /i je borelovsky meratelná, je h^1(B) G B. Potom ale {lo G íl : h{X{Lo)) G B} = {u; G íí : G /i_1(-B)} G A * Veta 9.2. Nech zobrazenie h : R™ —>• Rm je borelovsky meratelné, t.j. VB G Bm je {x = (x1;G R": h(xi,x n)' G B} G Bn. Nech X = (Xi,je n—rozmerný náhodný vektor na (Í2, A, P). Potom Y = h(X) je m—rozmerný náhodný vektor. Dôkaz: Nech B e Bm. Potom z meratelnosti h vyplýva, že h_1(P) — {X G R™ : h(X) e B} e Bn. Preto {u; G íl : h(X(w)) G P} = {u; G íí : X(w) G h"1 (P)} G A * 37 V ďalšom sa budeme zaoberat rozdelením pravdepodobnosti transformovaných náhodných veličín, resp. transformovaných náhodných vektorov. Poznámka. Pracovat budeme s Lebesgueovým integrálom z borelovsky meratelnej funkcie ip vzhladom k Lebesgueovej-Sieljesovej miere lá, p na borelovskej množine A, t.j. budeme pracovat s integrálom (p(t)dnp(t) = / tp(t)dF(t). a Ja Keď pracujeme s Lebesgueovým integrálom vzhladom k Lebesgueovej miere, tak J= / (p(t)dn(t)= / (p(t)dt. Ja Ja Poznámka. Pokial je distribučná funkcia F funkciou "skokovitou", t.j. je to distribučná funkcia diskrétnej náhodnej veličiny s pravdepodobnostnou funkciou (xi,pi)iej (J je konečná alebo spočitatelná), je 1= f tp(ť)dF(ť) = V^OPi J a r- A Ak je F distribučná funkcia spojitej náhodnej veličiny s hustotou /(•), tak / = / R™, teda h\,hn sú reálne funkcie n premenných x\, ...,xn. Jakobián (Jacobiho determinant) zobrazenia h je dh Z?h(x) — det —— — det or / dhi ôxi \dx! dx„ \ dxn Ak označíme y — h(x), teda y\ — /ij(x), i — 1,2,n, tak povieme, že zobrazenie h je regulárne na množine M C R™ ak (i) M je otvorená, (ii) funkcie h\, ...,hn majú spojité prvé parciálne derivácie na M, (iii) Vx e M platí, že P>h(x) ^ 0. Zobrazenie h je prosté na M, ak platí xi e M, x2 e M, xi ^ xi =4> h(xi) ^ h(x2). Veta 9.4. (Veta o substitúcii.) Nech h je zobrazenie otvorenej množiny F C R™ na Q C R™, nech h je regulárne a prosté zobrazenie na P s Jakobiánom PV Nech M C Q je borelovská a H : R™ —>• R reálna 39 meratelná a integrovatelná funkcia. Potom platí í H(y)dy = í if(h(x))|Dh(x)|dx. jm Jh-1(m) Dôkaz: Jarník, V., Integrální počet 1,11, NCSAV, Praha, 1955. Bezprostredným dôsledkom tejto vety sú nasledujúce dve vety. Ich dôkazy nájdeme napr. v Anděl, J., Matematická statistika, SNTL/Alfa, Praha, 1985. Veta 9.5. (Veta o hustote transformovaného náhodného vektora.) Nech náhodný vektor X — (Xi, ...,Xn)' má hustotu /x(x); x G R™. Nech h je zobrazenie R™ do R™, ktoré je regulárne a prosté na otvorenej množine G, pre ktorú platí JG /x(x)dx — 1. Ak h-1 je inverzné zobrazenie k h, potom má náhodný vektor Y — h(X) hustotu /y (y) tvaru í/x(h-1(y))|JDh-1(y)|, akyeh(G) /y (y) = < I 0, inak. Veta 9.5a. (Zovšeobecnená veta o hustote transformovaného náhodného vektora.) Nech náhodný vektor X — (Xi, ...,Xn)' má hustotu /x(x), x e R™. Nech h je zobrazenie R™ do R™, ktoré je regulárne a prosté na disjunktných otvorených množinách Gi,G2,... a zobrazuje ich na h(Gi), h(G2),pričom platí platí f q /x(x)^x — 1, kde G — Ujli G j- Ak označíme hj1 inverzné zobrazenie k h : G j —>• h(Gj), j — 1,2,...,, potom má náhodný vektor Y — h(X) hustotu /y (y) tvaru /y (y) — YlJLi f j (y); kde ;/x(h71(y))|JDh-1(y)|, akyeh(Gj) /j (y) _ . 0, inak Ukážeme si dva príklady. Príklad 9.3. Nech X = (X1; ...,Xn)' je náhodný vektor absolútne spojitého typu s hustotou /x- Nech A je regulárna matica typu n x n. Nájdite hustotu náhodného vektora Y — AX. Riešenie. A je regulárna a preto zobrazenie y — h(x) = Ax je regulárne na otvorenej G — R™, Inverzné zobrazenie je x — h_1(y) — A_1y. lahko sa vidí, že £)h-i(y) — det A-1 — ^ ^ a preto /y(y) = ^/X(A-V), y e R". Príklad 9.4. Nech AT je spojitá náhodná veličina s hustotou f x (x). Nájdite hustotu náhodnej veličiny Y = X2. Riešenie. Použijeme Vetu 9.5. Funkcia h : R —> R daná predpisom y — h{x) — x2 je regulárna a prostá na disjunktných otvorených množinách G\ — {—oo,0),G2 = (0,oo), pričom tieto množiny zobrazuje na h(Gi) — (0,oo) a h(G2) — (0,oo) a Jq—q^q fx(x)dx — 1. /i^1 dané predpisom h^1(y) — — y/y je inverzné zobrazenie k zobrazeniu h: G\ — (—oo, 0) —> h(G\) a h~^~(y) — y/y je inverzné zobrazenie k zobrazeniu h: G2 = (0, oo) ->• /i(G2). Pre y e /i(Gi) je (y) = -7T"7= a pre y e h(G2) je (y) = —!—. Náhodná premenná y = h(X) má preto hustotu Mj/) = /i(j/) + /2(j/) ^)2jž{fx{.-y/v)+fx{y/v)), ak y e (0, oo) 0, inak. Poznámka. Často potrebujeme spočítat hustotu náhodnej veličiny Y — /i(X), kde X — (Xi, ...,Xn)' a /i je reálna borelovsky meratelná funkcia n premenných. Ak íx je distribučná funkcia náhodného vektora 40 X, tak distribučná funkcia náhodnej veličiny Y je FY(y) = P(Y m )meJ> tak Y — /i(X) má pravděpodobnostmi funkciu (Vjipf^jeK, kde {y j : j G K} — {/i(xm) : m G J, /i(xm) rôzne } a pf> = P(y = %) = P(/i(X) = %) = P({X G B*y.}) = = px(p;3) = E Pí(x), {x,: h(xl)=yj} kde p*3 = {x4 : /i(x4) = %}. • ak X = (-X"i, ...,Xn)' je náhodný vektor absolútne spojitého typu, sú dve možnosti. (i) FY(y) = f{(xi^yeRn. h{xu Xn)• R™, aby spĺňala predpoklady Vety 9.4, nasledovným spôsobom: y = /i(x) ^2 = ^2 J/n — -^n Takto dostávame náhodný vektor Y — (Y, Y2,13,1^)' = h(X). Spočítame jeho hustotu /y(y) = /x(h_1(y))|.Dh-i (y)| a nakoniec marginálnu hustotu fy(y) = fc{y,y2,-,yn)dy2...dyn s.v. vzhladom na Lebesgueovu mieru. Príklad 9.5. Nech X\ ~ Po(Ai),X2 ~ Po(X2) a X1;X2 sú stochasticky nezávislé (niekedy sa značí Xi _L X2). Aká je pravdepodobnostná funkcia náhodnej veličiny Y — Xi + X2 ? (y \ (x ) \ A^ Riešenie. Xi, í — 1, 2 má pravdepodobnostnú funkciu (j, p j )jgn0 , kde pj = e~ ~jf, j — 0,1,2,.... n(X) Náhodný vektor X = (X±, X2Y má pravdepodobnostnú funkciu [(i,j),Pr\) 1 kde V i.*, j; y (íj)eNoxNo ?S = 5{^i = i, X2 = j} = P{X1 = z}P{X2 = j} = Pí(Xl)pf2) = _ r-(A1+A2)AlA2 Náhodná veličina Y — X\ + X2 má pravdepodobnostnú funkciu a my = {yfc}fceK = j) = í + j : (i, j) G N0 x N0} (rôzne) teda MY = {A: : /j G N0} (rôzne) a iy)= E PÍŠ = E pmxa) {(í,i)eN0xN0: h(i,j)=i+j=k} {(í,i)eN0xN0: í+j=fc} 41 l^Pi Pk-t -2^e i\(k-i)\ i=0 i=0 v ; i=0 1 e k\ ^ \ i k\ čiže Y ~ Po(Ai + A2). Pre súčet dvoch náhodných veličín dostávame pomocou predchádzajúcej Poznámky nasledujúcu vetu. Veta 9.6. Nech náhodný vektor X — (Xi,X2)' je spojitého typu s hustotou f(x1,x2)(xii x2)- Potom je náhodná veličina Y — X\ + Aľ2 absolútne spojitého typu a jej hustota je fY(y)= f(xux2)(y - x,x)dx = / f(Xl,x2)(x,y - x)dx s.v •J— oo j— oo Dôkaz: Ak zvolíme transformáciu h(x): y — xi + x2 V2 = x2, tak h-1 (y)je xi = y - 2/2 ^2 = 2/2, a Dh-i(y,y2) = det í * M = 1, čiže f(y,y2)(y, V2) = f(xux2)(.V - V2, V2) a Ak zvolíme transformáciu Vi = xi y = xi + 2ľ2, tak úplne analogicky dostaneme fy(y)= f(xux2)(y - x,x)dx. /OO f{xux2){x,y - x)dx s.v.* -OO Dôsledok. Ak sú vo Vete 9.6 náhodné veličiny Xi a X2 nezávislé, tak f(x1,x2)(xiix2) — fx1(%i)fx2(x2) a náhodná veličina Y — X± -\- X2 má hustotu /OO /" oo M (y - x)fx2 (x)dx = / fXl (x)fx2 (y - aľ)rfaľ s.v. -oo J — oo Hustotu f y (y) nazývame v tomto prípade konvolúciou hustôt fxt a fx2 a označujeme /y = fxt * /x2 Nasledujúcu vetu dokážeme úplne analogicky ako Vetu 9.6. a jej dôsledok. Veta 9.7. Nech Xi,X2 sú nezávislé náhodné veličiny s hustotami /i a f2. Potom (i) Y — X\X2 má hustotu g(y) = / h (-) Í2(x)-rKdx, s.v.; J_00 \xJ \x\ (ii) ak je f2 (x) — 0 pre x < 0 a c > 0 daná konštanta, tak náhodná veličina Z — ^f^- má hustotu 1 f°° (zx\ h(z) = ~ h \~) Í2(x)xdx, 42 Predchádzajúce vety využijeme na odvodenie najdôležitejších rozdelení (okrem už spomenutého normálneho rozdelenia), ktoré budeme používat v štatistike. Veta 9.8. Nech X1;Xn sú nezávislé N(0,1) rozdelené náhodné veličiny. Náhodná veličina Y = Xl+Xl + ... + Xl má x2 rozdelenie s n stupňami volnosti (označujeme Y ~ \n) s hustotou f(y) = 2fp(»^t~le~l pre y > 0 a f (y) = 0 pre y < 0. Dôkaz: Vetu dokážeme indukciou. Pre n — 1 je pre x > 0 Fx2{x) = f^X? < x} = P{-^ < Xi < y^} - P{-yG = XJ = preto _e 2 dt, V2-7T fxl(x) =-rFx*(x) =-=e 2 (y/x)--=e 2 -\/x) 1 (XX 1 V2-7T V27T 1 _a 1 1 _x l 1 \ 1 _a _i 1 _x _1 e 2 --==e 2 — —^—=e 2 x 2 — —.-—e 2 x 2 V2^ 2^x~ V 2V% J VŽy^ 2iT(i) (lebo r(|) — y/Ťv). Teda veta platí pre n—l. Nech platí pre n, potom pre n + 1 je />oo /x2+...+x2+1 (z) = y fx2+...+x2 O - u)fx2+1 (u)du 22T ——(x —u)2 1e 2 ——-—-—u 2 e 2 du (f) 2ir(|) e 2 2^r(f )r(i) Jo (x — u)2 1u 2du (substitúcia ^ — w, du — xdw, pričom P(a,/3) — Jq(1 — x)a 1x@ 1dx) 1 -1 rl — "+1 -1 e 2x2 x 2x / _ i_i , e 2x 2 2^r(f)r(i) Jo " ' 2^r(f)r(i) (1 - w)*-xw*~xdw = 4n-é) " 2^íir(2±i)aľ 2 Veta 9.9. Nech X a V sú nezávislé náhodné veličiny, X ~ V ~ x^. Náhodná veličina U — -p- má m Fisherovo-Snedecorovo F rozdelenie s k & m stupňami volnosti (značíme U ~ Pfc,m) a hustotu 2 pre u > 0 ^ 2 / v 2 a /[/(m) — 0 pre w < 0. r(^) (k\* ji-i + 43 —X Dôkaz: Platí U — k^ . Využijeme Vetu 9.7(ii) a Vetu 9.8. Dostávame pre u > 0 (pre u < 0 je hustota x\ rovná 0) mJo H2fr(|) \ m J 2-r(f )* , . , Ä: í00 1 íuykX'1 1 1 _« , fu(u) = — y-T—r-l - e 2- ,hr,mJ2 e 2dy Ä; \ 2 m 2 -i m j 2^r(|)r(f) Jo (substitúcia + 1) = í) 2H-r(|)r(f) Vo (M + i)^1-16 r(f)r(i) W 1 m k + 7, Veta 9.10. Nech X ~ x2. Náhodná veličina Y — \[X má x rozdelenie a n stupňami volnosti (značíme Y ^ x-n) a hustotu 1 2 My) = 2f-ir(»)^"'le'%" Pre y > 0 a /y (y) = 0 pre y < 0. Dôkaz: Náhodná veličina Y nadobúda (rovnako ako X) len kladné hodnoty. Pre y > 0 je 2 FY(y) = P{Vx existuje; (ii) ak P (X = a) = 1 =4> g (X) = a; (iii) ak existujú g(X{), £(X2) =>■ g(a\X\ + a2X2) — a\g(X\) + a2g(X2); (iv) ak existujú g(X1), g(X2) a X1 < X2 =4> g(X{) < g(X2); (v) ak |Xi| < X2 a existuje g(X2), tak existuje g(X{); (vi) nech P (X > 0) = 1 a existuje g (X) =4> g (X) > 0. Dôkaz vyplýva z vlastností Lebesgueovho integrálu. Ďalšie vlastnosti strednej hodnoty, hlavne vzorce vhodné na jej výpočet vyplývajú z vety o prenose integrácie z meratelného priestoru (íl, A) na meratelný priestor (K,T>) pomocou meratelnej funkcie g. Táto veta v prípade, že (A, T>) — (R™, Bn) a g je n—rozmerný náhodný vektor znie: Veta 10.2. (O prenose integrácie.) Nech X — (X\, ...,Xn)' je náhodný vektor definovaný na pravde-podobnostnom priestore (íl, A, P), g je borelovsky meratelná funkcia na (R™,£>™), Px je rozdelenie pravdepodobnosti náhodného vektora X. Potom í <7(XM)dPM = í ff(x)dPx(x) Jn Jr" v zmysle, že ak jeden z integrálov existuje, tak existuje aj druhý a rovnajú sa. Poznámka. Ak má náhodný vektor X — (X\,Xn)' distribučnú funkciu F(-), potom rozdelenie pravdepodobnosti Px — /í_f, kde /xp je Lebesgueova-Stieltjesova miera indukovaná distribučnou funkciou F a môžeme písat / ff(XH)dPH = / ff(x)dMF(x) PÍŠ=me / <7(x)dF(x). J n J rn J rn Priamym dôsledkom vety o prenose integrácie je nasledujúci dôsledok, pomocou ktorého spočítame strednú hodnotu náhodnej veličiny Y — g(X), ked g je borelovská funkcia a X náhodná veličina. 45 Dôsledok. Nech X je náhodná veličina a g borelovská funkcia. Potom stredná hodnota náhodnej veličiny Y — g(X) existuje práve vtedy, ak existuje a je konečný integrál \g(x)\dF(x) < oo. V tomto prípade platí /oo g(x)dF(x) -oo (teda Y — g(X) e £i(íl, A, P) <^ \g(x)\dF(x)dx < oo). Špeciálne (a) ak je X diskrétna s pravdepodobnostnou funkciou (xi,pi)iej, potom 8(Y) existuje práve vtedy ak Sígj \g(xi)\pi < oo a platí 8(Y) = Yg(Xi^Pi ieJ (tedaY = g(X)e£1(n,A,P) Eí£j lff(*i)lí>i < oo). (b) ak je X spojitá s hustotou /, potom S (Y) existuje práve vtedy ak existuje \g(x)\f(x)dx < oo a platí /oo g(x)f(x)dx -OO (teda Y = g{X) e d(íl, A. P) 4^ |íř(x)|/(x)dx < oo). V prípade, že v predchádzajúcom Dôsledku uvažujeme funkciu g (x) — x, vieme spočítat strednú hodnotu náhodnej veličiny X nasledovne: Dôsledok. Nech X je náhodná veličina na (íl, A, P). Potom stredná hodnota náhodnej veličiny X existuje práve vtedy, ak existuje a je konečný integrál \x\dF(x) < oo. V tomto prípade platí /oo xdF(x) -OO (teda X e jCi(fž, A, P) \x\dF(x)dx < oo). Špeciálne (a) ak je X diskrétna s pravdepodobnostnou funkciou (xi,Pi)iej, potom 8(X) existuje práve vtedy ak Y^teJ \xi\Pi < oo a platí 8 (X) = Y xiPi ieJ (teda X e Cx(íl,A,P) ^ Eí£j Wŕ1* < °°)- (b) ak je X spojitá s hustotou /, potom S (X) existuje práve vtedy ak existuje \x\f(x)dx < oo a platí /oo xf(x)dx -oo (teda X e d(íl,A,P) ^ \x\f(x)dx < oo). V prípade, že máme náhodný vektor, tak použijeme nasledujúci dôsledok. Dôsledok. Nech X — (X\,Xn)' je náhodný vektor definovaný na (íl, A, P) a g(x\,xn) borelovská funkcia. Potom stredná hodnota náhodnej veličiny Y — i, kde Xj = 0,1, 2,... a Pi — e —-. x i. Preto oo . ■ oo . ■ oo . ■_1 oo ,fc í m = E^A j = «-A E Tj^w = ^A E t^t = ^A E f =a Príklad 10.2. Stredná hodnota náhodnej veličiny s normálnym rozdelením. Nech X ~ N(/i, c2), cr > 0, teda jej hustota je /(x) — _ e 2»2 , x G (—oo, oo). Potom V27T(7 £(X) — I xf(x)dx — _ / xe 2»2 dx = -oo V27T(7 (substitúcia y = ^5^, x — ay + fi, dy — ^) ^ r00 2 r00 2 r00 ^ 2 (ay + n)e~~dy ——=. I ye~~dy + /j, / _e~~dy — \i, 27T J-00 V27T J-00 J-oo V27T lebo ye^3^ je nepárna (lichá) funkcia. Veta 10.3. (Stredná hodnota súčinu nezávislých náhodných veličín.) Nech Xi,...,Xn sú nezávislé náhodné veličiny na (íl, A, P) a nech existujú stredné hodnoty £(Xi),i — 1, 2,n, (t.j. Xi G £i(íl, -4, P)). Potom platí n n i=l i=l Dôkaz: Položme Y — Jl™=i teda g(x±,x„) == xiX2...x„. Podlá posledného Dôsledku je / #(xi,...,x„) 0, (ii) V(X)=g(X2)-g2(X), (iii) ak P (X = o) = 1, tak £>(X) = 0, (iv) X>(ai + a2X) = a|£>(X), (v) ak Ai a A2 sú nezávislé, tak V(XX ± A2) = V(XX) + V(X2). Dôkaz: (i) Pre náhodnú veličinu Y — (X — £(X))2 platí, že P(Y > 0) — í, preto z vlastnosti strednej hodnoty g (Y) = £>(X) > 0, (ii) 2?(X) = £ (X - £(X))2 = g[X2 - 2Xg(X) + (g(X))2} = = £(X2) - 2£(X)£(X) + (g(X)f = £(X2) - g2(X), (iii) ak je P(X — a) — í, tak A je diskrétna náhodná veličina s pravdepodobnostnou funkciou (a, 1), teda g (X) = «Uaa V (X) = £(X - £(X))2 = (a - a)2 • 1 = 0, (iv) £>(ai + a2A) = £[ai + a2A - g(ai + a2X)]2 = £(ai + a2A - ai - a2g(X))2 = £[al(X - £(X))2] = a2£(X-£(X))2=a22?(X), (v) 2?(A1±A2) = £[A1±A2-£(A1±A2)]2 = ±X2-f^) T£(A2)]2 = £[(X!-^XO)2 ±2^ - g(X1))(X2 - g(X2)) + (A2 - £(X2))2] = g(Xľ -g(X1))2 +g(X2 - g(X2))2 ± 2g[(Xľ -g(X1))(X2 -E(X2))]. Pretože sú Xx a A2 nezávislé, platí g(XxX2) = g(X1)g(X2). Ale tiež (Xi - g(X1)) a (A2 - g(X2)) sú nezávislé a tiež g[(Xx - g(X1))(X2 - g(X2))] = £(Xi - £(Xi))£(X2 - g(X2)) = 0. Dostávame, že V(X1±X2)^V(X1) + V(X2). * Príklad 10.3. Rozptyl náhodnej veličiny s poissonovským rozdelením (rozptyl Poissonovho rozdelenia). x^ Nech X ~ Po(X), teda A má pravdepodobnostnú funkciu (xí,pí)í>\, kde xí — 0,1, 2,... a. pi — e~A^y. V Príklade 10.1. sme spočítali, že g (X) = A. Platí £>(X) = £(X2) - g2(X). Spočítame 3=0 j' I ' 3=2 j' 48 j=2 u >' j=0 J' j=0 J' Preto V{X) = £(A2) - £2(A) = A2 + A - A2 = A. Príklad 10.4. Rozptyl náhodnej veličiny s normálnym rozdelením. Nech X ~ A^/i, cr2), a > 0, teda jej hustota je /(x) — _ e 2»2 ; x e (—oo, oo). V Príklade 10.2. sme spočítali, že £(X) — [i. Preto v27r(7 /oo i />oo ^ _ ý (x - n)2f(x)dx = / (x - n)2e~^~dx : -oo \/2lT(7 J-oo (substitúcia m — x — au + /i, i. Vo všeobecnosti tieto podmienky neurčujú medián jednoznačne. Ďalšia charakteristika je modus x. Ak je náhodná veličina diskrétneho typu s pravdepodobnostnou funkciou (xi,pi)i>i, tak ž je to číslo Xj, pre ktoré platí P{X — x) > P(A = Xj), z — 1, 2,.... Ak má X spojité rozdelenie s hustotou /, za modus považujeme tú hodnotu ž G R, pre ktorú platí f (x) > f (x), — oo < x < oo. Ani modus nie je vo všeobecnosti určený jednoznačne. Zavedme si funkciu F-1 predpisom F-1(u) = inf{x G R : F(x) > u}, 0 < u < 1. Funkcia F-1 sa nazýva kvantilová funkcia zodpovedajúca distribučnej funkcii F. Hodnoty F-1 (u) sú kvantily. Teda a—kvantilom je F_1(a). Ak je F rastúca a spojitá, potom F-1 je inverzná funkcia k distribučnej funkcii F. Veta 10.5. (Cebyševova nerovnost.) Nech X je náhodná veličina s konečným druhým momentom. Potom pre lubovolné s > 0 platí P(|A-£(A)|>e) 0 položme M£ — {lú : \X(lú) — £(X)\ > e}. P{uj : \X(u)-£(X)\>e}= j dP(w) = f ídP(uj) < f (XH -£(X)Ydp^ < ■/Me e 49 <-í (iH-£(i))2dPH^w e2 Jq e2 teda P(\X - £(X)\ > e) < ^P-. * Poznámka. Z Cebyševovej nerovnosti dostávame V(X) P(\X - £{X)\ < e) = 1 - P(\X - £{X)\ >é)>l- t2 V prípade, že zvolíme e — k^/V(X), je špeciálne pre k — 3 P(|X - £p0| < 3VX>(X)) > 1 - i = 0.89. 9 Kovariancia a korelačný koeficient V nasledujúcom budeme předpokládat, že náhodné veličiny majú konečné druhé momenty. Definícia 10.3. Kovariancia náhodných veličín X a Y je (číslo) C{X,Y) = £[{X - £{X)){Y - £{Y))] a korelačný koefícient r(X,y)- c{x>y) y/v{x)v 0,V(Y) > 0. Niekedy značíme R(X,Y) ako gx,y Pomocou vety o strednej hodnote transformovaného náhodného vektora dostávame Veta 10.6. Ak náhodné veličiny X a Y majú združenú distribučnú funkciu F (x, y), potom oo />oo C{X,Y)= / (x-£(X))(y-£(Y))dF(x,y), teda (a) v prípade, že (X, Y)' je náhodný vektor s pravdepodobnostnou funkciou ((xm,ym),pm)mej, tak (b) v prípade, že (X,Y)f je spojitý náhodný vektor so združenou hustotou f (x,y), tak OO nOO C{X,Y)= / (x-£(X))(y-£(Y))f(x,y)dxdy. co J —co Veta 10.7. (Vlastnosti kovariancie a korelačného koeŕicienta.) Nech X a Y sú náhodné veličiny, s konečnými nenulovými rozptylmi, ai, 02,61,62 G R- Potom (i) C{X, X) = V{X) a R{X, X) — 1; (n) c(x,y) = c(y,x) a i?(x,y) = i?(y,x); (ííí) c(x,y) = £(xy)-£(x)£(y); (iv) ak sú X a y nezávislé náhodné veličiny, tak C {X, Y) — R(X, Y) — 0; 50 v) \C(X,Y)\ < ^/V{X)V{Y) = oxoY a \R{X,Y)\ < 1; vi) C(ai + a2X, bx + b2Y) = a2b2C(X, Y) a ak a2 ^ 0, b2 ^ 0, tak i?(ai + a2X, 6i + b2Y) = i?(X, y)sign(a262); vii) V(X ± Y) = £>(X) + £>(T) ± 2C(X, y); viii) R(X, Y) — í <í=4> existujú konstanty a a 6 > 0 také, že P(y = a + bX) — 1 a y) = —1 ^=^> existujú konstanty a a b < 0 také, že P(y = a + 6X) = 1. Dôkaz: i) C(X, X) = £(X £{X)f = a R(X, X) = = 1; ii) C(X, Y) = £[(X - £(X))(Y - £(Y))} = £[(Y - £(Y))(X - £(X))} = C(Y, X), C(X,Y) C(YX) teda aj R(X, Y) = . v ' 1= = . v ' = i?(y, X); yp(x)yp(y) yp(y)yp(x) iii) C(X, Y) = £[(X - £pQ)(y - £(y))] = £[XY - X£(Y) - Y£(X) + £(X)£(Y)} = £(XY) - £(X)£(Y); iv) ak su X a y nezávislé, tak £{XY) = £(X)£(y) a teda C(X, y) = f(Iľ) -£{X)£{Y) = £(X)£(y) - £(X)£(y) = 0 a preto aj R{X,Y) = 0; v) podia Schwarzovej nerovnosti oo r-oo L(X) ± 2C(X, y) + £(y); (viii) R(X,y) — 1 =>• |C(X,y)| = y/T>{X)T>{y) > 0, t.j. nastala rovnost v Schwarzovej nerovnosti (10.1), ktorá môže nastat práve vtedy ked 1. 3b ŕ 0, že hf{{x, y) G R2 : y- £{y) = 6(x - = 1, alebo keď 2. /íf{(z, y) e R2 : x - = 0} = 1 alebo /zF{(x, y) e R2 : y - £(y) = 0} = 1. Pretože v druhom prípade by bola T>(X) — 0 alebo T)(y) — 0 (čo nemôže byt), nastáva iba 1. prípad a teda 36^0 P{lu: y(uj)-£(y) = b(X(uj)-£(X))} = l, čiže 3b ŕ 0 P{y = f (y) - b£(X) + b(X) = a + bX} = l. 51 Preto C(X, Y) = C(X, a + bX) = bC(X, X) > 0 (podlá (vi)) a b > 0. Prípad ižpf, Y) = — 1 dokážeme úplne analogicky. £ Poznámka. Ak je Cpf, y) = 0, teda ak je R(X, Y) — 0, potom povieme, že náhodné veličiny laľsu nekorelované. Príklad 10.5. Nech (X, Y) je diskrétny náhodný vektor s pravdepodobnostnou funkciou ((x,y)i,Pi)iej, pričom M = {(x, y)i}ieJ = {-1,0,1} x {-1,0,1} a 1) = -1) = 1) = -1) = i, p(0, 0) = |, p(—1,0) = p(0,1) = p(0, —1) = p(l,0) = 0. Vypočítajte R(X,Y) a rozhodnite, či X a y sú nezávislé. x\y -1 0 1 Px(x, -1 1/6 0 1/6 2/6 0 0 1/3 0 1/3 1 1/6 0 1/6 2/6 vy {y) 2/6 1/3 2/6 1 Riešenie: £(x) = Exe{-i,o,i} xpx(x) = (-1)| + 0§ + 1§ = 0 a rovnako £(y) = 0. Ďalej f(Iľ) = = E(,,,)e{-i,o,i}x{-i,o,i}^ = + + + 1 ' H = 0, teda C(X,y) = £(Xy)-£(X)£(y) = 0. Náhodné veličiny X a y sú nekorelované. Alepx,y(-1, -1) = § ^ Px{-1)py{~1) = 2 2 1 6 6 9' 11. Charakteristická funkcia Pravděpodobnostně správanie sa náhodných veličín a vektorov úplne charakterizuje ich rozdelenie pravdepodobnosti resp. distribučná funkcia. Mnoho vlastností náhodných veličín alebo vektorov je ale tažkopánde a zdĺhavé dokazovat pomocou distribučnej funkcie. Pracujeme preto s iným analytickým vyjadrením rozdelenia pravdepodobnosti, a síce s Fourierovou-Stieltjesovou transformáciou, ktorá sa v teórii pravdepodobnosti volá charakteristická funkcia. Definícia 11.1 Charakteristická funkcia náhodnej veličiny X je komplexná funkcia reálnej premennej ip(-) : R —>• C definovaná ako V>(t) = £ (eltx) , í G R. V teórii pravdepodobnosti sa dokazuje množstvo vlastností charakteristických funkcií. Niektoré sú obsahom nasledujúcej vety. Dôkazy tejto aj nasledujúcich viet nájdeme v napr. knihe Rényi, A., Teorie pravděpodobnosti, ACADEMIA, Praha, 1972. Veta 11.1. Nech X je náhodná veličina a ip(t) jej charakteristická funkcia. Potom (i) |V(t)| < 1 Vie R; (ii) V(0) = 1; (iii) Ví e R Mť) = (iv) V(í) je rovnomerne spojitá na R. (V e > Q 3 á > 0 V tít%. |t2 - ^ | < 5 W*2) ~ V'(íi) I < e) Veta 11.2. Ak existuje prvých n momentov n'n náhodnej veličiny X a tieto momenty sú konečné, potom charakteristická funkcia ip(t) náhodnej veličiny X má prvých n derivácií a platí V>(fc)(0)=iVk, a: =1,2,..., n. 52 Ďalej platí #) = E^+°(í"), fe=0 k\ kde o(tn) je taká fumkcia, že limt^o ^ = 0. Veta 11.3. Ak je ip(t) charakteristická funkcia zodpovedajúca distribučnej fumkcii F(x) a a, b, a < b body spojitosti funkcie F(x), tak platí F(6)-F(a) = iř£ ^—ita _ g—itb 2ít 2Íí dt. Veta 11.4. Ak pre charakteristickú funkciu ip(t) náhodnej premennej A platí \ip(t)\dt < oo, tak má A spojitú hustotu f (x) a môžeme ju vyjádřit v tvare 1 /(*) = 2tt ip(t)e-ltxdt. Príklad 11.1. Nech X ~ -^(^), teda A má alternatívne rozdelenie s pravdepodobnostnou funkciou (xi,pi)i=it2, pričom xi — 0, X2 — í a pi — í — 6, p2 — 0. Charakteristická funkcia tejto náhodnej premennej je il>x(ť) = £{eltx) = eitel(l - °) + eltX20 = eít0(l - 6») + e4*1^ = 1 - 9 + elt9. Charakteristická funkcia Y ~ Bí(n, 6) je tp(t) = (l - 0 + elt6)n. Príklad 11.2. Nech A ~ Ro(—a,a) (rovnomerne rozdelená na (—a, a)). Potom jej hustota je —, ak — a < x < a 2a 0, ak x £ (—a, a). Charakteristická funkcia tejto náhodnej veličiny je pre t ^ 0 V>(t) = £ (eítx) eltxf(x)dx = / eltxf(x)dx = — 2a z't 1 eíta — e íta cos(ía) + zsin(ía) — cos(—ía) + zsin(ía) sinat 2a zt 2aí aí V>(0) = £ (eí0X) = / eWxf(x)dx = 1. ^ —oo Príklad 11.3. Nech U ~ X(0,1). Jej charakteristická funkcia je 1 ^TTj-oo V27T (substitúcia u — it — s, du — ds, môže sa použit aj Dodatok na str. 90) e 2" du 3-hl(u-Uf+ŕ]du^ e 2 lt2 1 VŽň j- _is2 , -í± e 2 ds = e 2 Dokážte, že charakteristická funkcia A ~ N(fj,,a2), a2 > 0 je tpx(t) — eÍM*e "2* . (Použite substitúciu 53 Dokážme si ešte niektoré vlastnosti charakteristickej funkcie. Veta 11.4. Nech X je náhodná veličina, ipx(t) jej charakteristická funkcia, a, b reálne čísla. Potom náhodná veličina Y — a + bX má charakteristickú funkciu tpy (t) — elta%l)(tb). Dôkaz: V>y(t) = 8 (eltY) = 8 (>(a+bx)) = £ (eítaeltbx) = elta£ (eltbx) = elta^x{tb). * Najdôležitejšie aplikácie pre charakteristickú funkciu plynú z nasledujúcej vety. Veta 11.5. Nech X\ a X2 sú nezávislé náhodné veličiny s charakteristickými funkciami ipi(t) a ip2(t). Potom náhodná veličina X — X\ + X2 má charakteristickú funkciu ipx(t) — ipi(í)ip2(t). Dôkaz: yjx(t) = £ (eiť<*1+*2>) = £ (eítXleítX2) = £ (eítXl) £ (eítX2) = MQM*)- * Upozorňujeme len, že tvrdenie Vety 11.5 podlá nasledujúceho protipříkladu nemožno obrátit. Príklad 11.4. Nech Xi má Cauchyho rozdelenie s hustotou f (x) — ^j^ri, x E R. Položme X2 — X\ a spočítajme charakteristickú funkciu náhodnej veličiny X — X\ + X2 — 2X\. Charakteristická funkcia náhodnej veličiny Xi je 1 ľ°° 1 fe(í) = -/ eUx——dx = e-W 7T J_OD 1 + x1 (podlá rezíduovej vety, môže sa použit aj Dodatok na str. 98). Pretože X — 2Xi, je V* (t) = Í>o+2xÁt) = eítVx1(2í) = e-l2tL Dostali sme tjjXl+Xl(ť) — tjjXl(t)ijjX2(t), ale X\ a Aľ2 nie sú nezávislé. Charakteristická funkcia náhodného vektora Nech X — (X\, X n)' je n—rozmerný náhodný vektor. Definícia 11.2. Funkciu tp : R™ —>• C definovanú predpisom budeme nazývat charakteristickou funkciou náhodného vektora X. Analogicky ako v jednorozmernom prípade sa dajú odvodit vlastnosti charakteristickej funkcie náhodného vektora. Veta 11.6. Platí (i) |V>(t)l < 1 Pre všetky t e R"; (ii) V(0,0,...,0) = V(O) = l; iii) ip(-t1,-t2,...,-tn) = ipih, ...,í„); iv) ijj je rovnomerne spojitá na R"; v) b e Rm, Amri je matica reálnych čisel, Y = b + AX, potom ipY(u) = eíu b-0x(A'u), m e R" vi) ked existujú stredné hodnoty 8(Xj) pre j — 1, 2,n, potom 9í, = i£(X,0; t=(0,0,...,0) 54 (vii) keď existujú stredné hodnoty £(XjXk) pre j, k — 1, 2,n, potom "<92i/>(t)" dtjdtk t=(0,0,...,0) (viii) ak "0j(í) je charakteristická funkcia náhodnej veličiny Xj, potom ipj(tj) — i/>x(0, 0,t j, 0,0); (ix) nech X má charakteristickú funkciu i/>x(íi, ín) a Y má charakteristickú funkciu ipY(ti, ...,tn), pričom X, Y sú nezávislé, potom Z — X +Y má charakteristickú funkciu i/>z(t) a platí i/>z(t) = i/>x(t)i/>Y(t); (x) zložky náhodného vektora X = (Xi,X2, ...,Xn)' sú nezávislé práve vtedy ak i/>x(t) — ilľ=i^^i(^) (dôkaz pozri v Rényi, A. Teória pravděpodobnosti, ACADEMIA, Praha, 1972). 12. Konvergencia náhodných veličín Majme postupnost náhodných veličín Xi,X2,... a náhodnú veličinu X. Nech sú všetky tieto veličiny definované na (tom istom) pravdepodobnostnom priestore (íl, A, P). Definícia 12.1. Povieme, že Xn konverguje k X skoro iste, ak P({u: X„H->XH}) = 1. Ak pre každé e > 0 platí P({u: |X„H-XH|>e})->0, potom povieme, že Xn konverguje k X podlá pravdepodobnosti. Nech £(X2) < oo pre n — 1,2,... . Ak platí £ ((Xn - Xf) -> 0, potom povieme, že Xn konverguje k X podlá (kvadratického) stredu. Nech Xn má distribučnú funkciu Fn(-) a nech Nech X má distribučnú funkciu F(-). Povieme, že Xn konverguje k X v distribúcii ak Fn(x) konverguje k F (x) v každom bode x, v ktorom je F(-) spojitá. Táto konvergencia sa často označuje aj ako C(Xn) —> C(X) a hovorí sa, že Xn má asymptotické rozdelenie C(X). Niekedy sa táto konvergencia volá aj slabá konvergencia. Lenia 12.1. (i) Postupnost Xn konverguje k X podlá pravdepodobnosti práve vtedy, ak Ve > 0 a > 0 existuje no, že pre všetky n > uq platí P({u: \Xn(w)-X(w)\>e})<5. (ii) Postupnost Xn konverguje k X podlá pravdepodobnosti práve vtedy, ak \/k G N a \/ô > 0 existuje n0, že pre všetky n > uq platí P({u: \Xn(ic)-X(ic)\>^})<5. (iii) Postupnost Xn konverguje k X podlá pravdepodobnosti práve vtedy, ak Ve > 0 P({u: |X„H-XH|>e})->0. Dôkaz je jednoduchý a spravte si ho ako cvičenie. Veta 12.1. (Limitná veta pre charakteristické funkcie.) Nech je daná postupnost distribučných funkcií Fi(-), F2(-),... a im zodpovedajúca postupnost charakteristických funkcií ipi(-), ip2('), ■■■ ■ K tomu, aby postupnost {Fn(-)} konvergovala k nejakej distibučnej funkcii F(-) vo všetkých bodoch spojitosti tejto funkcie, 55 je nutné a stačí, aby postupnost {ipn(')} konvergovala v každom bode k nejakej funkcii ip(-), ktorá je spojitá v bode t — 0. Ak je táto podmienka splnená, tak tjj(-) je charakteristická funkcia odpovedajúca distribučnej funkcii F(-) a postupnost {ipn(')} konverguje k ip(-) rovnomerne na každom konečnom intervale. (V V e>0 3 N V n>N V t£ |^n(í)-^(í)| oo platí n n ■ i=l podlá pravdepodobnosti. Dôkaz: Ľahko sa vidí, že platí 2 S(X) = n, V(X) = —. n Z Cebyševovej nerovnosti (Veta 10.5) dostávame pre V e > 0 2 P(\X-v\>e) < ^, ^_2 pričom samozrejme pre n —> oo platí —- —> 0, takže P(\X — /i| > e) —> 0. ♦ ne2 Iná modifikácia tohto zákona, ktorá sa často používa v štatistike je Veta 13.2. (Chinčinova) Nech Xi,X2,... sú nezávislé náhodné veličiny rovnako rozdelené s konečnou strednou hodnotou /i a definované na (rovnakom) pravdepodobnostnom priestore (íl, A, P). Potom pre n —> oo platí — 1 " n i=l 56 podia pravdepodobnosti. Dôkaz nájdeme napríklad v knižke Anděl, J., Matematická statistika, SNTL, Praha, 1985. Niektoré dôsledky uvedených zákonov velkých čísel sú napr. Dôsledok. Nech Xi, X2,... sú (po dvoch) nezávislé náhodné veličiny s rovnakými strednými hodnotami /i (konečnými) a s rozptylmi D (Xi) < c, í — 1, 2,.... Potom {X^}^^ spĺňa zákon velkých čísel. Dôsledok (Markovova veta). Nech X\,X2,... sú (po dvoch) nezávislé náhodné veličiny s rovnakými strednými hodnotami /j, (konečnými) a s rozptylmi T) (Xi), pričom linin^oo ;j2 2}(Eľ=i X i) — 0. Potom {Xn}n%.1 spĺňa zákon velkých čísel. Dôsledok (Bernoulliho veta). Majme postupnost nezávislých pokusov, pričom každý može končit úspechom s pravdepodobnosťou 9 alebo neúspechom s pravdepodobnosťou 1 — 9, (9 E (0,1))- Označme náhodnú veličinu Yn — počet úspechov v n nezávislých pokusoch. Zn — —Yn je relatívna početnosť úspechov v n pokusoch. Platí, že n Zn — —Yn —> 9 n podía pravdepodobnosti. Dôkaz: Ak označíme náhodnú veličinu i 0, ak v z—tom pokuse bol neúspech X i — _ 1, ak v z—tom pokuse bol úspech. X1,X2,... sú nezávislé, P(Xl = 0) = 1 - 9, P(Xl = 1) = 9, £(Xi) = 9, V (Xi) = 9(1 - 9) < i. Platí Yn = Eľ=i X i a Zn — —Yn — — Eľ=i X-i- Podlá Dôsledku pred Markovou vetou Zn —>• 9 podlá pravdepodobnosti. Vyššieuvedené tvary zákona velkých čísel zaručovali konvergenciu (výberového priemeru) Xn k strednej hodnote /j, podlá pravdepodobnosti. Preto sa volajú slabé zákony velkých čísel. Dajú sa odvodiť vety, ktoré zaručujú takúto konvergenciu skoro iste. Volajú sa silné zákony velkých čísel. Poznámka. K tomu, aby postupnosť náhodných veličín Xi,X2,... spĺňala silný zákon velkých čísel, stačí, aby táto postupnosť spĺňala podmienky Chinčinovej vety. Toto tvrdenie sa volá II. Kolmogorova veta a jej dôkaz je napr. v knižke Dupač, V., Hušková, M., Pravděpodobnost a matematická statistika, KAROLINUM, Praha, 2001. Tam nájdeme aj iné formulácie silného zákona velkých čísel. 14. Centrálne limitné vety Majme postupnosť nezávislých náhodných veličín X\, X2,ktoré sú definované na tom istom pravdepodob-nostnom priestore (íl, A, P). Ak £(Xi) — (ii a T)(Xi) — o\, tak náhodné veličiny C i — X i — hí nazývame centrované (majú nulovú strednú hodnotu); Vi — —-—— nazývame štandardizované (majú nulovú strednú hodnotu a jednotkový rozptyl). Co je štandardizovaný priemer nezávislých náhodných veličín X\,X2,... ? -i n 1 n 1 n 1 n £(Xn) = £(-= - V(Xn) = V(-= o\, 57 preto štandardizovaný priemer nezávislých náhodných veličín X\,X2, ■■■je _Xn- £{Xn) _ \ YlÍ=i xi - \ Eľ=i _ Yh=\(xí - Mi) U- Ak 8{Xi) — /j, a, V{Xi) = n2, tak Eľ=i(^-M)_Eľ=i(^-M)_ i U- xn \/Eľ=i :(Xi + ... +X„ - n/t). Centrálne limitné vety tvrdia, že za dost všeobecných podmienok má štandardizovaný priemer nezávislých náhodných veličín asymptoticky normované normálne rozdelenie. Teda konverguje v distribúcii k náhodnej veličine s N(0,1) rozdelením. Veta 14.1. (Lindebergova CLV.) Nech X\,X2,... sú nezávislé náhodné veličiny s rovnakým rozdelením pravdepodobnosti so strednou hodnotou /i a konečným nenulovým rozptylom a2. Potom 1 Uxn = :(Xi + ... + Xn-nn) konverguje k distribúcii k náhodnej veličine X ~ N(0,1). Dôkaz: Položme V _ X%-ji i = 1,2, Náhodné veličiny Yi,Y2l... sú nezávislé a štandardizované, teda £(Yi) — /t^ — 0. Ich rozptyl je 1. Je to aj ich počiatočný moment druhého rádu, teda /t2. Nech charakteristická funkcia ich rozdelenia je ip(-). Podlá Vety 11.2 je / (it)° , (ít)1 , (ít)2 , 2. , t2 . 9. kde o(í2) je (nejaká) funkcia R(t), pričom lim.t_>o — 0. y. Charakteristická funkcia ipj(t) náhodnej veličiny —j= je Pretože — Y £ Yn . £[e1^ je charakteristická funkcia ipn(t) náhodnej veličiny U-^ rovná ŕ l-Yn+R pričom pre každé pevné í je lim nR —= lim ť n—>oo ť lim Pre každé pevné t dostávame lim ipn(t) — lim R(4- V V™ v™ e 2 čo je charakteristická funkcia náhodnej veličiny s N(0,1) rozdelením. Podlá Vety 12.1 máme vetu dokázanú. 58 Veta 14.2 (Ljapunovova CLV.) Nech X\,X2,... sú nezávislé náhodné veličiny pre ktoré existujú konečné momenty £(Xk) = Mfc, V{Xk) = a\ > 0, £\Xk - Mfc|3 = H*, k — 1,2,.... Položme Sn = vIČLi^l #n = \/Efc=i ^fc- Potom Ljapunovova podmienka lim„^oo —^ = 0 je postačujúca k tomu, aby pre každé x G R lim P (U y < x) = lim P f ^L^Íi_l < a; J = —J= / e~^dt. oo Dôkaz nájdeme napr. v knihe Rényi, A., Teorie pravděpodobnosti, ACADEMIA, Praha, 1972. Poznámka. Existuje vela modifikácií CLV. Mnohé nájdeme v knihe Rényi, A., Teorie pravděpodobnosti, ACADEMIA, Praha, 1972. Veta 14.3 (Moivreova-Laplaceova integrálna veta.) Nech p G (0,1) a Z\,Z2,... sú náhodné veličiny s binomickým rozdelením, teda Zn ~ Bi(n,p). Potom platí pre každé x G R yjnp(\ - p) j \/2ŤŤ oo Dôkaz: Veta je špeciálnym prípadom Vety 14.1 (Lindebergova CLV) ak Xi, í — 1,2,..., sú nezávislé, Xi ~ A(p) (A(p) je alternatívne rozdelenie s parametrom p). Potom £(Xi) — ii a T)(Xi) — p(í — p) — a2. Platí E™=i Xi — Zn ~ Bí(n,p) a U-y — —-={X\ + ... + Xn — n/i) — —. " ^= konverguje v distribúcii 3 " &Vn sjnp(l-p) k náhodnej veličine s N(0,1) rozdelením. Jft Poznámka. Veta sa dá sformulovať aj nasledovne: Pre p G (0,1), —oo < a < b < oo nech Z\, Z2,... sú náhodné veličiny s binomickým rozdelením, teda Zn ~ Bi(n,p). Potom platí lim P [ a < Zn~np < 6 ) = $(&) - $(a), y \/np(l - p) j kde $(•) je distribučná funkcia normovaného normálneho rozdelenia. Príklad 14.1. Nájdite približnú hodnotu pravdepodobnosti toho, že počet šestiek, ktoré padnú v 12000 hodoch homogénnou kockou bude medzi 1900 a 2150. Riešenie: ťažko by sme spočítali Eľ=igoo (12°°°) (^(f)12000-*- Pretože n = 12000, Zn ~ Pí(12000, \),£{Zn) np = i^oo = 2000, V{Zn) = np(l - p) = 2000§ = ±2222, dostávame P(1900 < Zn < 2150) = P(1900 - £(Z„) < Zn - £{Zn) < 2150 - £{Zn)) = = p /1900\-E{Zn) < Zn-g(Zn) < 2m)-£{Zn)\ = _ p 1900 - 2000 < Zn -np 2150 - 2000 ^±2222 y/np{\ - p) J. 10000 = P(-2.45 < f" UP < 3.67) = $(3.67) - $(-2.45) = i/np(l - p) = 0.9998 - 0.0071 = 0.9927 (lebo $(—it) = 1 — Q(u), kde $(•) je distribučná funkcia ./V(0,1) rozdelenia). 59 15. Popisná štatistika (podia Zvára, K., Štěpán, J. Pravděpodobnost a matematická štatistika, Matfyzpress, Praha, 2001) Štatistika skúma javy na rozsiahlom súbore prípadov a zaujímajú ju tie vlastnosti javov, ktoré sa prejavujú vo veľkom súbore prípadov, nie v jednotlivých prípadoch. Základný pojem je štatisticky súbor (základný súbor). Je to dobre definovaná (určená) množina štatistických jednotiek. Štatistický súbor môže byt určený zoznamom svojich prvkov (jednotiek), alebo pomocou nejakého pravidla, predpisu. V prípade pochybností sa dá overit, či skúmaná jednotka patrí do štatistického súboru alebo nie. Na štatistických jednotkách sa meria (určuje, pozoruje) jeden alebo viac štatistických znakov. Znaky podlá typov delíme na Nominálne znaky, ktorých hodnoty sú disjungtné kategórie. Medzi hodnotami nie je žiaden vztah, usporiadanie. Napríklad farba očí, politická příslušnost, atd. Ordinálne znaky sú vlastne nominálne znaky, ale ich hodnoty sa dajú usporiadat. Napríklad najvyššie dosiahnuté vzdelanie, hodnost u vojska, počet hviezdičiek v hotelovej kategórii, atd. Poznáme len poradie hodnoty znaku, neexistuje "vzdialenosť' medzi hodnotami. Intervalové znaky nadobúdajú číselné hodnoty. Sú teda usporiadané, ale poznáme u nich aj (prirodzenú) vzdialenost medzi hodnotami. Sú charakteristické tým, že nula je u nich len dohodnutá (napr. teplotné stupnice). Poměrové znaky, ktorých hodnoty sa vztahujú na nejakú dohodnutú jednotku. Hodnoty znaku udávajú násobok dohodnutej jednotky. Nula znamená neexistenciu meranej vlastnosti. Sem patrí napr. väčšina fyzikálnych veličín. Štatistické znaky nominálne, či ordinálne sa nazývajú kvalitatívne, intervalové či poměrové znaky sa nazývajú kvantitatívne (niekedy kardinálne). Kvantitatívne znaky delíme na diskrétne a spojité. Predpokladajme, že sme na n štatistických jednotkách namerali súbor hodnôt x\, x2, ...,xn daného znaku. Celkovému počtu prvkov súboru hovoríme rozsah súboru. Ako spracovávame, zhrnieme, oznamujeme hodnoty súboru ? Ak jednotlivé hodnoty (ordinálneho resp. kvantitatívnho) znaku usporiadame do neklesajúcej postupnosti < x (2) < ■■■ < x (n), dostaneme usporiadaný súbor hodnôt. Indexy v dolných zátvorkách udávajú poradie jednotlivých zistených hodnôt znaku. Najmenšia je x^, najväčšia je x^ny Ked je súbor velký a hodnoty sa často opakujú, prehľadnejšie ich zapíšeme do tabulky početností, v ktorej a\ < a2 < ... < am sú navzájom rôzne usporiadané hodnoty znaku v súbore (v prípade nominálneho znaku len rôzne hodnoty) a n1; n2,nm sú zistené (absolútne) početnosti týchto hodnôt (t.j. n^—krát bola nameraná v súbore hodnota znaku en). Zrejme J^t=i n« ~ n- Takýmto spôsobom sa typicky spracovávajú kvalitatívne znaky a diskrétne znaky. V prípade kvantitatívneho spojitého znaku postupujeme nasledovne. Ked meraný znak nadobúda príliš vela rôznych číselných hodnôt, umelo zmenšíme počet rozlišovaných hodnôt tak, že obor všetkých hodnôt rozdelíme na disjunktně intervaly. Zvolíme napr. hraničné body (—oo <)ío < íi < ■■■ < tm{< oo) a všetky hodnoty znaku z j— teho intervalu (tj-\,tj > (niekedy je vhodnejšie < tj—i,tj)) stotožníme so stredom tohto intervalu a j — —1 J . Ak je to — —oo, spravidla zvolíme a± — t\--2—^—-, takže t± je v strede intervalu (ai,a2). Podobne pre tm — oo spravidla volíme am — ím_i H—m 1 —m 2 . Najčastejšie sa volia íi,í2, ...,ím_i tak, aby intervaly boli rovnako dlhé (až na krajné). Teda t j — tj-i — h, j — 2, 3, ...,m — 1. 60 Teraz určíme počty n j hodnôt Xj, ktoré patria do jednotlivých intervalov (tried), tzv. triedne početnosti. Potom napíšeme tabulku početností. Tabulku početností znázorníme graficky pomocou polygónu početností, ked lomenou čiarou spojíme body o súradniciach (a j, n j), j — 1,2,...,m. častejšie znázorníme tabulku početností histogramom, keď nad intervalmi (a j — + ^ >j 3 — 1,2,..., m kreslíme obdĺžnik, ktorého výška je rovná n j. Ak triedne intervaly nemajú rovnakú šírku, je n j výška obdĺžnika nad zodpovedajúcim intervalom. Do uvedených grafov sa dá namiesto absolútnej početností rij znázornit aj relatívna početnosť f j — —, prípadne sa dajú absolútne resp. relatívne početnosti sčítat (kumulovat) a použit buď ^Ž2j\=\uí alebo 5j?=1 f í (kumulatívne diagramy). Príklad 15.1. V tabulke 15.1 sú uvedené triedne početnosti priemerných známok na koncoročnom vysvedčení u 372 detí. Zodpovedajúce histogramy (triednych početností a kumulatívnych triednych početností) sú (obr. 10.1 v Zvára, K., Štěpán, J. Pravděpodobnost a matematická štatistika) Histogram triednych početností Histogram kumulatívnych triednych početností 61 interval < 1 < 1 < 1 < 1 < 1 < 2 < 2 < 2 < 2 < 2 < 3 < 3 < 3 < 3 tj) 1,2) stred aj 1,1 1,3 1,5 1,7 1,9 2,1 2,3 2,5 2,7 2,9 3,1 3,3 3,5 3,7 početnost rij 31 48 29 37 27 41 32 19 28 23 24 25 4 4 kumul. početnost Nj 31 79 108 145 172 213 245 264 292 315 339 364 368 372 Tabulka 15.1 Poznámka. Obyčajne používame triedne intervaly konštantnej šírky. Pri volbe počtu intervalov môžeme vyjst zo Sturgesovho pravidla, podlá ktorého m = 1 + 3,3 log10 n = 1 + 1,43 ln n. Tejto hodnoty sa pridržiavame "približne". Miery polohy Miery polohy udávajú hodnotu, okolo ktorej sa nachádzajú jednotlivé pozorovania (hodnoty znaku). Priemer (tiež výberový, či empirický aritmetický priemer) ^ n ^ m - x% — - i Ti -' TI -' x ~ n X% ~ n njQ'j' i=i j=i Priemer sa určuje u kvantitatívnych znakoch a rovnakým spôsobom závisí od každej hodnoty znaku. Zrejme pre lubovolné a, b je _ 1 n a + bx (— — } (a + bxi)) — a + bx, TI -' n i=l takže sa prirodzene mení so zmenou merítka. Geometrický priemer xq — ýx1x2...xn. Geometrický priemer má zmysel len ked všetky hodnoty znaku sú kladné. Nie je invariantný voči lineárnej transformácii údajov. Používa sa v prípade, že ide o násobenie. Častejšie sa používa v ekonómii. Napr. ak je inflácia 20%, 50%, 30%, 20% a 5% (v jednotlivých rokoch), tak je to to isté, ako keby bola inflácia každý 62 rok 24%, lebo výsledná inflácia je 1, 2.1, 5.1, 3.1, 2.1, 05 — 2, 9484 a to je to isté ako keby v každom roku bola ^1,2.1,5.1,3.1,2.1,05 = 1, 24. Harmonický priemer 1 xH — Z^i—1 Tiež nie je invariantný voči lineárnej transformácii. Dá sa ukázat, že ak sú všetky hodnoty znaku kladné, tak platí % h <\ xg —\ x (pozri napr. Anděl, J., Statistické metódy, Matfyzpress, Praha, 1993). Medián (rozumie sa výberový medián) je definovaný pomocou usporiadaného súboru hodnôt < x{2) < ■■■< x{n) ako Íx/n+i\, ak n je nepárne (liché) í \ \ í x^„^ + x^„+1^ J ak n je párne (sudé). Je to taká hodnota, ktorá delí usporiadané hodnoty x^,x^), na dva rovnako početné diely. Preto nezáleží, aké velké (malé) sú prvé resp. posledné členy usporiadaného súboru x^,x^), Platí (a + bx) — a + bx. Ak g(-) je monotónna funkcia, potom analogická vlastnost platí pre transformované hodnoty. Ak je počet hodnôt nepárny (lichý), platí táto vlastnost presne, ak je počet hodnôt párny (sudý), platí "skoro presne" (g(x) nie je vo všeobecnosti v tomto prípade priemerom hodnôt q(x^n^), q{x^n+2\). Pre nepárny (lichý) počet meraní má medián zmysel už pri ordinálnom znaku, pri párnom (sudom) počte meraní potrebujeme kvantitatívny znak. Keby sme pre párny (sudý) počet meraní definovali medián ako lubovolné číslo, pre ktoré platí x^-^ < x < x^n+1y nebol by síce definovaný jednoznačne, ale existoval by aj pre ordinálny znak (s číselnými hodnotami). Medián môžene zovšeobecnit. Namiesto toho, aby odděloval polovicu najmenších údajov od ostatných, môže oddělovat p—ty diel údajov. Zvolíme p, 0 < p < 1. Definujeme p—ty výberový kvantil (percentil) vzťahom X{[np}+i), aknp^[np] \ (x(nP) + X(nP+i)) ak np = [np], kde [np] je celá časť np, t.j. najväčšie celé číslo nie väčšie ako np. Napr. pre p — 0,12, n — 24 je [np] — [2, 88] — 2, teda 2:0,12 — X(3) a pre p — 0, 4, n — 50 je [np] — [20] — 20, teda 2:0,4 — \ (^(20) + x(2i))-U ordinálneho znaku (číselného) ak np — [np], môžeme ako xp použiť lubovolnú hodnotu, ktorá leží medzi x([np}) a Medián je špeciálny prípad výberového kvantilu, a síce x — 2^5. V grafických zobrazeniach sa používajú dolný kvartil a horný kvartil Ql — 2ľo,25, q3 — x0,75- Modus je najčastejšou hodnotou. Má zmysel najmä vtedy, ak je počet m skutočne sa vyskytujúcich rôznych hodnôt podstatne menší ako rozsah n súboru. Modus je použitelný pre každý typ znaku (aj ked v 63 prípade nominálneho znaku je tažko hovořit o miere polohy). Nemusí byt určený jednoznačne (bimodálne súbory). Miery variability Miery variability charakterizujú velkost variability hodnôt znaku okolo nejakej "miery jej polohy", alebo "roztrúsenost" hodnôt znaku. Miera variability by mala byt invariantná voči "posunutiu" všetkých hodnôt znaku, resp. voči lineárnej transformácii hodnôt znaku. Rozptyl (empiricky rozptyl) 1 " n *—' n i=l resp. ak a\ < a2 < ... < am sú rôzne hodnoty znaku, tak m n i=i Platí „2 /t X 1 1 1 n z—' n z—' n z—' n z—' n z—' i—l i—l i—l i—l i—l — — [ x2 — nx2 | . n\tí J Niekedy sa používa ~2 ^E^--)2 n - _ i=l (neskôr budeme analyzovat prečo). Ked sa používajú triedne početnosti, doporučuje sa Sheppardova korekcia, čo znamená zmenšit výraz 1 m _ h2 s2 — — EJLi nj(aj ~ x)2 ° hodnotu —, kde h je šírka rovnako širokých triednych intervalov. Smerodajná odchýlka (empirická smerodajná odchýlka) Jej dôležitá vlastnost je, že je vyjadrená v rovnakých jednotkách ako namerané údaje. Rozptyl aj smerodajná odchýlka záležia na všetkých údajoch (sú citlivé na hodnoty najmä "krajných" údajov). Rozpätie je rozdiel maximálnej a minimálnej hodnoty R = X(n) - X(l). Rozpätie záleží len na velkosti maximálnej a minimálnej hodnoty. Kvartilové rozpätie RQ = ktorý môže byt kladný aj záporný (Kladná (pravá) šikmost je ak hustota je koncentrovaná v "lavej" časti grafu a " pomaly dlho graf klesá). Kvantilový koeficient šikmosti X\—p Xp X\—p Xp pre 0 < p < 0, 5. špeciálne pre p — 0, 25 to je kvartilový koeficient šikmosti (Q3 - ž) - (ž - Q{) Qs-Qi Výberový koeficient špicatosti (excess) 92 - -7---í a kvantilový koeficient špicatosti X(n) - X{1) X\—p Xp pre 0 < p < 0, 5. Diagramy Velmi názorné a oblúbené sú vedia histogramov aj iné grafické znázornenia nameraných údajov a ich vlastností. Zaradujeme ich medzi exploračné (výskumné) štatistické metódy (EDA - Exploratory Data Analysis). Krabicový (fúzatý) diagram (box plot, box and whisker plot). Má mnohé modifikácie, napr. (obr. 10.2, Zvára, K., Štěpán, J. Pravděpodobnost a matematická štatistika) Na krabicovom diagrame sú Qi, Q3, x, Rq, tykadlá (fúzy) siahajú k takému najvzdialenejšiemu (od odpovedajúceho kvartila) pozorovaniu, ktoré nie je od neho vzdialené viac ako 1,5 násobok kvartilového rozpätia. Jednotlivo sú znázorňované pozorovania, ktoré 65 sú viac vzdialené. U niektorých programov siahajú "fúzy" k najmenšiemu resp. k najväčšiemu pozorovaniu. Inokedy k výberovému 10% resp. 90% kvantilu. Príklad 15.2. (Jednoduchý prípad.) Namerali sa údaje 21,24,24,25,25,25,25,25, 26,26,27,27, teda n = 12. lahko vidíme, že ž = 25, Qi = x0,25 = 5^(3) + ^(4)] = ^(24 + 25) = 24, 5, Q3 = ^0,75 — ^[^(g) + ^(ío)] — 26. Rq — Q3 — Qi — 26 — 24,5 = 1,5. Najmenšie pozorovanie je odlahlé, lebo 21 < 24, 5 — 1, 5.1, 5 — 22, 25. Krabicový diagram je uvedený vyššie. Príklad 15.3. Zistovali sa hmotnosti detí v 12. mesiaci ich veku. Histogramy početností dievčat a chlapcov sú (obr. 10.3, Zvára, K., Štěpán, J. Pravděpodobnost a matematická štatistika) 66 Oba histogramy ukazujú na kladnú šikmost. Vidiet, že hmotnosti chalpcov sú v priemere väčšie ako dievčat. Odpovedajúce krabicové diagramy sú (obr. 10.4, Zvára, K., Štěpán, J. Pravděpodobnost a matematická štatistika) Ked chceme vyjádřit závislost (súvislosť) dvoch kvantitatívnych znakov s nameranými hodnotami ), (xn,yn), použijeme rozptylový diagram, na ktorom sú znázornené body [aľj,j/j]. Tri rôzne typy závislostí sú na nasledujúcich obrázkoch (obr. 10.5, Zvára, K., Štěpán, J. Pravděpodobnost a matematická štatistika) 67 Ak sledujeme súčasné správanie sa niekolkých znakov, užitočný sa ukazuje maticový diagram, v ktorom sú znázornené súčasne histogramy pre jednotlivé znaky a (vzájomné) rozptylové diagramy (obr. 10.6, Zvára, K., Štěpán, J. Pravděpodobnost a matematická štatistika) 68 16. Náhodný výber Štatistike sa niekedy hovorí, že je metodologická náuka, ktorá objektivizuje proces poznania. Skúsme si popísat, ako sa to dosahuje. Základný súbor (štatistický súbor) voláme tiež populácia. Predpokladáme, ze má N jednotiek (N ^> 0). Principiálne môžeme zmerat hodnotu kvantitatívneho znaku Z na každej jednotke a dostat hodnoty z\, z2,zn. Priemer hodnôt z celej populácie označme /i a budeme ho nazývat populačný priemer. Označme cr2 populačný rozptyl, teda 1 N 1 N i=l i=l Pretože N je velmi velké, nie je možné (resp. je velmi nehospodárne) zmerat hodnotu znaku na každej jednotke. Preto vyberieme skupinu n jednotiek a zistíme hodnotu znaku len na týchto jednotkách. Tento výber (výberový súbor) musí byt taký, aby dobre reprezentoval celú populáciu (celý základný súbor). Budeme vždy předpokládat, že n < N. Jeden zo spôsobov dosiahnut " dobre reprezentujúci" výberový súbor je urobit náhodný výber bez vrátenia (prostý náhodný výber). To znamená, že vyberieme jeden z N prvkov základného súboru, potom náhodne vyberieme jeden z N — 1 zostávajúcich, atd., až jeden z N — n + 1 zostávajúcich. Výberový súbor môžeme vybrat (^) spôsobmi. Keď budeme prvky výberového súboru vyberat náhodne, tak dosiahneme požadovanú reprezentativnost a každá n—tica bude mat rovnakú pravděpodobnost, že bude vybraná.. My sa sústredíme na tzv. výber s vrátením z konečnej populácie. Náhodne vyberieme z populácie nejaký prvok (nejakú štatistickú jednotku), zistíme hodnotu meraného znaku a vrátime ho spät. Označme X — hodnotu znaku na náhodne vybranej štatistickej jednotke. Zrejme X je náhodná veličina, ktorá nadobúda hodnoty bi < b2 < ... < bm s pravdepodobnostami P{X — bj} — j*-, j — 1,2, ...,m, kde n j je počet tých štatistických jednotiek v základnom súbore, na ktorých je hodnota znaku rovná bj. Platí m ^ m £(X) = bjP{X = bj} = -£ njbj = M i=i i=i v{x) = £{x - M)2 = jr>,- - tfp{x = b,} = - ri2 = i=i i=i Ked nezávisle vyberáme n—ticu štatistických jednotiek (po náhodnom vybratí štatistickú jednotku vždy vrátime spät do súboru), tak tento výber modelujeme n— ticou (X\, ...,Xn) náhodných veličín, pričom sú (združené) nezávislé a rovnako rozdelené (ako náhodná veličina X). Teraz sa pozrime trochu ináč na výber s vrátením. Nemusíme sa starat o hodnoty z±, z2,zjq (resp. b\, ...,bm) znaku, ale stačí nám vediet, aký je pre dané (ale lubovolné) z G R pomer p{z) množstva tých štatistických jednotiek, na ktorých hodnota znaku je menšia ako z k celkovému počtu jednotiek, teda k N. čiže {počet tých Zi, ktoré sú menšie ako z} =-ň-■ Vyberme náhodne jednu štatistickú jednotku (zrealizujme náhodnú veličinu X) a označme nameranú hodnotu x. Teda ak hodnota znaku na tejto jednotke je x, je to (konkrétna) realizácia náhodnej veličiny X. Platí Fx(x) = P (X < x) = p(x). 69 Preto X má distribučnú funkciu Fx(-) — p(-)- Už nás nezaujíma, či populácia je konečná, alebo nekonečná. V reálnom živote je vždy konečná, ale ked je N velmi velké, považujeme ju za nekonečnú. V takomto "veľkom" základnom súbore aj ked realizujeme výber bez vrátenia, môžeme považovat vybrané hodnoty za realizácie nezávislých náhodných veličín. (Intuitívne to znamená, že pri "nekonečne" velkom základnom súbore odobratie niekolkých jednotiek prakticky nezmení funkciu p(x).) V prípade náhodného výberu s vrátením (z konečnej alebo "nekonečnej" populácie) alebo náhodného výberu bez vrátenia z "nekonečnej" populácie je výsledkom pokusu n—tica nezávislých náhodných veličín X\, X2, Xn rovnako rozdelených, ktoré majú (rovnakú) distribučnú funkciu Fx(-)- Takáto n—tica náhodných veličín sa nazýva náhodný vyber rozsahu n (n nezávislých kópií náhodnej veličiny X). Predpokladajme, že náhodná veličina X má konečnú strednú hodnotu \x a disperziu a2. V prípade konečnej populácie sa táto stredná hodnota rovná populačnému priemeru a disperzia rovná populačnému rozptylu. Náhodnú veličinu 1 n x i=l nazývame výberový priemer a náhodnú veličinu S i=l výberový rozptyl. Aké vlastnosti majú výberový priemer a výberový rozptyl ? Veta 16.1. Pre výberový priemer platí £{X) = /i, „2 V{X) = -. n Dôkaz: £(X)=£ / n \ n n \ n —' / n —' n —' \ i=l J i=l i=l (1 n \ 1 n 1 n 2 n z—' / nz z—' nz z—' n i=l J i=l i=l Veta 16.2. Pre náhodný výber rozsahu n z rozdelenia s konečným rozptylom a2 platí £{S2) = o2. Dôkaz: Platí 1 n _ í 1 n _ \ £{S2) = £—- X)2 = £ —- J2(X* m + m - X)2 = 2 = 1 \ 2 = 1 / n n n J2(XÍ - m)2 + 2 - - X) + nJ2(v - X): n — 1 \i=l 2£ (li-X)J2(Xt-ii) -£YiX-nf i=l i=l 70 -na 2 1 2£ n — 1 n — 1 n z—' n — 1 z—' ,2 _ 2^-£(X M)2 + -^-f (T - m)2 = ——cr2 - -^-2>(X) 1 n — 1 n — 1 n — 1 n — 1 n 2 #(, u 2 "C-----= (7 . n — 1 n — 1 n Ak je základný súbor rozsiahly, niekedy ho rozdelíme na L "neprekrývajúcich" sa častí, ktoré nazývame oblasti. Z každej oblasti vykonáme prostý náhodný výber (bez vrátenia). Každú oblast považujeme za "menší" základný súbor. Oblastné usporiadanie výberu (oblastný výber) je motivované napr. tým, že celý základný súbor pozostáva z "prirodzených" podsúborov, že zber dát v určitých podoblastiach je špecifický (finančne, časovo), atd. Oblasti môžu byt aj "umelo vytvorené". Ak sú rozsahy oblastí Ni, N2,Nl a oblastné výberové súbory majú rozsahy ni,n2, ...,til, potom celý základný súbor má rozsah N — Ni + ...+Nl a celý výberový súbor má rozsah n — ni + ... + n^. Ak iVi N2 "' NLK h tak hovoríme, že oblastný výber je rovnomerný. V takomto prípade má každá jednotka rovnakú pravde- tl podobnost — zahrnutia do výberu (nezávisle od toho, do ktorej oblati patrí). Ak sa základný súbor skladá z velmi velkého množstva jednotiek (roztrúsených), tažko uskutočníme aj oblastný výber. Vzniká potreba vyberat jednotky vždy po celých skupinách. Skupiny môžeme považovat za nové jednotky vzniknuté zlučovaním pôvodných jednotiek. Môžu to byt malé skupiny (napr. rodiny), alebo aj velmi velké (okresy, školy, závody v podniku). Tento spôsob výberu nazývame dvojstupňový výber. Najprv vyberieme skupinky, z ktorých potom vyberáme "prvotné" jednotky. Výber skupiniek nazývame prvým výberovým stupňom. Výber prvotných jednotiek nazývame druhým výberovým stupňom. Nech oblasti obsahujú po rade M\, M2,Ml skupiniek, z ktorých v prvom výberovom stupni vyberieme postupne mi, m2, ...,m,l skupiniek. V druhom výberovom stupni z každej výberovej skupinky v h—tej oblasti (ak táto skupinka bola v prvom stupni vybraná) vyberieme 1007r^ percent prvotných jednotiek. Ako zvolit čísla mi,TO£,7Ti, ...,ttl, aby každá prvotná jednotka mala rovnakú pravděpodobnost dostat sa do výberového súboru, bez ohladu na to, do ktorej oblasti resp. skupinky patrí. Označme náhodný javy A— štatistická jednotka J z h—tej oblasti bola vybratá do výberového súboru v druhom výberovom stupni B— skupina, do ktorej patrí štatistická jednotka J, bola vybratá v h—tej oblasti v prvom výberovom stupni Je zrejmé, že štatistická jednotka J bola vybratá do výberového súboru práve vtedy, ak nastal náhodný jav A n B. Platí P (A n B) = P(A\B)P(B). Zrejme P (B) = ^- a P(A\B) = irh. Preto pravdepodobnosti, že h prvotná jednotka z h—tej oblasti (h — 1, 2,L) sa dostane do výberového súboru sú postupne ui\ m2 m l Výber bude rovnomerný, ak ui\ m2 m l Mi71"1 ~ MŠ"71"2 ~ "' ~ ~Ml'KL' V tomto prípade každá jednotka v základnom súbore bude mat rovnakú pravděpodobnost dostat sa do výberového súboru. 71 Príklad 16.1. Pri štatistickom šetrení týkajúcom sa zisťovania sociálnych pomerov v rodinách školákov do 15 rokov prvý stupeň záležal od výberu škôl a druhý od výberu žiakov vybranej školy, školy boli rozdelené na 3 druhy (oblasti), a síce, (i) päťročné školy, (ii) deväťročné školy, (iii) osemročné gymnázia. Z päťročných TTl\ 1 škôl bola vybratá každá stá škola, teda-— - a z tejto školy boli zahrnuté do výberu všetci žiaci, teda Mi 100 ^ J 7ľi — 1. Z deväťročných škôl bola vybratá každá päťdesiata a do výberu z nej vybratý každý druhý žiak. Z osemročných gymnázií bolo vybraté každé dvadsiate piate a z neho vybratý každý štvrtý žiak. Teda mT 1 ~ TÔÔ' 7Tl = = 1, mi7Ti Mi 1 ~ Tôô' m2 1 7ľ2 = 1 m27r2 i ~M~2 " 50' 2' M2 ~ Tôô' m3 1 7T3 = 1 m3ir3 i M3 " 25' 4' M3 ~ Tôô' Každý žiak bez ohladu na druh školy mal pravděpodobnost dostat sa do výberu. V každom druhu výberu majú výberový priemer, výberový rozptyl a iné výberové charakteristiky špecifické (pravděpodobnostně, štatistické) vlastnosti. O tom pojednáva teória výberových šetrení. 17. Odhady parametrov (hlavne podia Anděl, J., Matematická statistika, SNTL/ALFA, Praha, 1985) Predpokladajme, že náhodný vektor X — (X\, X2, Xn)' má hustotu (v prípade diskrétneho náhodného vektora pravdepodobnostnú funkciu) /(x, 6), kde 6 — {6\, 92,9m)' je neznámy parameter. Na základe X je treba získat "čo možno najlepší" odhad tohto parametra. Vieme len tolko, že 6 sa nachádza v parametrickom priestore íl (pozor, nie je to tentokrát priestor elementárnych javov). Definícia 17.1. Bodový odhad parametra 9 — {6\, 62,6m)' je meratelné zobrazenie g : (R™, £>„) —>• (Rm, Bm) (nezávisiace od 6) také, že m—rozmerný náhodný vektor t — g(X) v nejakom "rozumnom zmysle" aproximuje neznámy vektor parametrov 6). Poznámka. Obyčajne predpokladáme, že náhodný vektor X — (X\, X2,Xn)' je náhodným výberom z rozdelenia s distribučnou funkciou f (■; 6). Preto sa niekedy pre upresnenie povie, že odhad T je založený na náhodnom vektore X. Definícia 17.2. Intervalový odhad parametra 6 — ((91; 92,9m)' je taká (náhodná) množina z Bm, ktorá s "dostatočne velkou" pravdepodobnosťou pokrýva 9. Poznámka. Namiesto parametra 6 môžeme uvažovat aj odhad určitej (konkrétnej) parametrickej funkcie h(0). Niekedy sa najprv vezmú nejaké meratelné funkcie Si (x),S'fc(x), vytvorí sa náhodný vektor S (X) — (Si (X), S2 (X),S k (X.))' (pre m < k < n). Každý takýto náhodný vektor sa volá štatistika. Ak k — m, tak takáto štatistika je (bodovým) odhadom. Definícia 17.3. Povieme, že odhad T parametra 9 je nestranný, ak platí veeo £e(T) = e. 72 Poznámka. Odhad T (ako predpis) nezávisí od 9, ale jeho rozdelenie pravdepodobnosti od 9 závisí. Preto sa v Definícii 17.3 píše £$(1). Zdôrazňuje sa tým, že stredná hodnota odhadu T sa ráta za predpokladu, že hodnota parametra rozdelenia je rovná 9. Niekedy nestranný odhad vôbec neexistuje, alebo existuje iný odhad ako nestranný, ktorý je z určitého hladiska výhodnejší. Príklad 17.1. Majme náhodný výber Xi, X2,Xn z rozdelenia s distribučnou funkciou F(-) a konečnou strednou hodnotou \x a disperziou a2. Náhodná veličina — 1 " r(4.,xn)-jr = -y;x n —' n ■ i=l je podlá Vety 16.1 nestranným odhadom parametra jjl. Podlá Vety 16.2 je sz = n — . i=l nestranným odhadom a2. Iným kritériom pre odhad T{X\,..., Xn) jednorozmerného parametra ř? je velkost jeho strednekvadratickej odchýlky, teda £{T- O)2. Platí £(T - O)2 = £ ((T - e {T)) + (£(T) - 9)f = = £[(T - £(T))2} + 2£[(T - £(T))(£(T) - 6)} + £[(£(T) - O)2] = V{T) + (£(T) - 6)2, čo je rozumná charakteristika odhadu. Ak platí £(T) = 0 + b(0), pričom (vektorová) funkcia b nie je identicky rovná 0 na množine íl, tak odhad T je vychýleny. Vektoru b(6) sa hovorí vychýlenie odhadu T v bode 9. Príklad 17.2. Nech A je diskrétna náhodná veličina s binomickým rozdelením pravdepodobnosti, teda A ~ Bi(n,p), pričom n považujeme za známe. Pre funkciu (píp) — — parametra p neexistuje nestranný P odhad založený na náhodnej veličine A. Ukážte. Riešenie: Sporom. Nech existuje odhad T, teda meratelná funkcia náhodnej veličiny A (kde A ~ Bi(n,p)), pre ktorú platí £P(T(X))^- Vpe(0,l). p Teda platí Vp e (0,1) £P(T(X)) = f>C7)(nV (1 = = T(0)(1 - p)n + T(í)np(í - p)"-1 + ... + T(n)pn(í -p)° = -. P Na lavej strane predchádzajúcej rovnosti máme polynóm premennej p stupňa najviac n, tento nemôže byt rovný racionálnej lomenej funkcii — pre všetky p G (0,1). Teda nestranný odhad parametrickej funkcie - p p založený na náhodnej veličine A ~ Bi(n,p) neexistuje. 73 Príklad 17.3. Majme náhodný výber Xi, X2,Xn z rozdelenia N(/i, a2), n > 2, a2 > 0. Pre výberový 1 — 2(74 rozptyl S2 = -—-£"=1(Xj - xf Platí ^C5,2) = íj2 (P°zri Vetu 16-2) a v(s2) = ~—j; (dokážeme si v kapitole 19). Majme odhad parametra a2 (ktorý odhad je typu) T (X) — c^2™=1(Xi — X)2. Pre aké c má tento odhad minimálnu strednekvadratickú odchýlku ? Čomu sa táto odchýlka rovná ? Riešenie: T — (n — í)cS2, preto £(T) = (n - l)c£(S'2) = (n - l)ccr2 a 2?(T) = (n - l)2c2£>(S2) = 2(74c2(n — 1). Strednekvadratická odchýlka odhadu T je £(T - a2)2 = X>(T) + (f (T) - a2)2 = 2(j4c2(n - 1) + [(n - l)C(r2 - ct2]2 = = cr4{2c2(n - 1) + (n - l)2c2 - 2c(n - 1) + 1} = cr4{c2(n2 - 1) - 2c(n - 1) + 1}. Vzhladom na c to ie kvadratická funkcia, ktorá má minimum (po derivácii) v bode c — -. Preto J v ; n +1 odhad P(X) = —-j—j- Eľ=i(^ — X)2 má najmenšiu strednekvadratickú odchýlku zo všetkých odhadov typu T(X) — cY^í=i(Xí — X)2. Táto minimálna strednekvadratická odchýlka je ^4 í n2 -í 2(n- 1) 1 _ 2cr4 ^ \(n + l)2 n+1 + J~n+ľ Uvažujme teraz jednorozmerný parameter 9. Nech Xi,X2,... sú nezávislé rovnako rozdelené náhodné veličiny definované na tom istom pravdepodobnostnom priestore (íl*, A., P) s rozdelením pravdepodobnosti, ktoré má distribučnú funkciu F(-,9). Pre každé prirodzené n majme Tn(Xi, X2, ...,Xn) - odhad parametra 9. Definícia 17.4. Tn je konzistentným odhadom 9, ak Tn konverguje podia pravdepodobnosti k 9, t.j. Ve > 0 P{lo G íl* : \Tn(uS) - 9\ > e} 0. Veta 17.1 Nech pre každé prirodzené n je £(T2) < oo. Ak (i) £(T„)->0 a (ii) V(Tn) -> 0, tak Tn je konzistentným odhadom parametra 9. Dôkaz: Využijeme dve nerovnosti, a síce V7 > 0 P{|£ — £(Q\ < 7} > 1 ~ (čebyševova nerovnost) a |a + 6|<|a| + |6| (nerovnost platná pre všetky reálne čísla). Preto {u : |T„H - 9\ < e} = {u : \Tn(u) - £(Tn) + £(Tn) - 9\ < e} D {lo : |T„M - £ (T„)| < I n |£ (T„) - 0| < |}, teda (17.1) P{lo: \Tn(Lo)-9\P{io: \Tn(u) - £(Tn)\ < | n |£(T„) - 9\ < |}. Platí, že ak A, B sú dva náhodné javy a P(P) = 1 => P (A D B) — P (A) (lebo A U P D B => 1 = P(P) < P(A U P) = 1 a 0 = P(A U P) — P (B) = P(A) - P(A n P)). Pretože £(T„) ->• 0 (s pravdepodobnostou 1), teda Ve>0 3nw Vn > n10 P{w : |£(Tn) - 0| < |} = 1, dostávame z (17.1) (17.2) Ve>0 3nw Vn > n10 P{^ : |T„H - 0| < e} > P{w : |T„H - £(T„)| < |}. 74 Pretože T>(Tn) —>• 0 (s pravdepodobnosťou 1), dostávame, že (17.3) Ve > 0 Vtf > 0 3n20 Vn > n20 V{Tn) < Ů- Z Čebyševovej nerovnosti zase platí pre každé n (17.4) Zo vztahov (17.3) a (17.4) dostávame, že Ve>0 P{u: \Tn(u)-S(Tn)\ < |} > 1 - ^J^. (17.5) Ve>0 W>0 3n20 že Vn > n20 P{w : |T„(w) - £{Tn)\ < -} > 1 - ú. Zo vztahov (17.2) a (17.5) dostávame, že Ve V$ > 0 Vn > maxjnio,n2o} P{^: \Tn(u) - 0\ < e} > P{u : \Tn{uo) - £(Tn)\ < > 1 - Ů. * Príklad 17.4. Nech Xi,X2,... sú nezávislé náhodné veličiny, každá s rovnomerným rozdelením pravdepodobnosti na intervale (0, 6), 6 > 0 (neznáme). Náhodná veličina X^ — max{Xi, X2, ...,Xn}. Ukážme, že X (n) je konzistentný odhad parametra 6. Pritom X(n) nie je nestranný odhad parametra 6. Riešenie: Hustota rozdelenia pravdepodobnosti náhodnej veličiny Xi, i G {1, 2,n} je j" ak t < 0 ak t G (0,6») ak t > 6. Preto distribučná funkcia FxM (x) = < x} = P{Xi < x,X„ < x} Hustota 0, ak x < 0 n^^Hu^r^. akxG(o, 1, ak x > ŕ?. i=l 0, /xM(x) = PiM(x) ak x < 0 ak x G (0,6) ak x> 9 Dostávame, že ô 1 nxn~ n £{X(n)) = / * V(X(n)) = £(Xfn))-£2(X(n)) nx™ n —--dx — — n+ 1 ■ x™+2 n + 2 n(9 n+ ľ ' n + 2' .2/12 n(92 n(92 n + 2 (n+1)2 (n+l)2(n + 2)' 75 Podia Vety 17.1 je X^ konzistentným odhadom 9 (£(Tn) —>• 9 a T>(Tn) —>• 0). Ĺahko v tomto prípade n+í získame nestranný konzistentný odhad. Stačí zvolit Tn — -X Teraz si zavedieme eŕicientný (výdatný) odhad. Majme jednorozmerný parameter 9 a náhodný vektor X — (Xi, ...,Xn)' nech má hustotu /(x, 9) (distribučnú funkciu F(x, 9). Majme odhad T — T(X) parametra 9. Aká je dolná hranica strednej kvadratickej chyby £(T — 9)2 ? Kedy sa táto hranica dosiahne ? Definícia 17.5. Systém hustôt {/(x, 9), ŕ? e íl} je regulárny, ak platí a) íl je neprázdna otvorená množina, b) množina M — {x : /(x, 9) > 0} nezávisí od 9, df (x, 9) c) pre V(9 G íl a pre skoro všetky x e M existuje konečná parciálna derivácia /'(x, = 0, 7'(x, d) pre V<9 e platí /M rfF(x, 96» /(x, ŕ?) e) pre Vr? G íl je integrál (výraz) J(0) = jm dF(x, 9) konečný a kladný (0 < J(9) < oo). ./(MV Veličinu J(0) voláme Fisherova informácia o parametri 9 (Fisherova miera informácie o parametri 9, ktorá (informácia) je obsiahnutá v danej regulárnej triede hustôt) . Fisherovu informáciu môžeme chápat aj ako J{9) = £e /7'(x) /' t £e d In/(X) d9 lebo mimo množiny M môžeme definovat — ľubovolne, teda aj ako 0 a za integračný obor vziat R™. Príklad 17.5. Systém hustôt {f (x, 9) — -y=e~' 2' ,—00 < x < oo,9 e íl = R} (vzhladom k Lebesguovej miere) je regulárny (ide o hustoty N(9, í)). Dokážte ako cvičenie. Veta 17.2. (Raova-Cramerova) Nech T je taký odhad 9, žeV6> e íl]e£e(T2) < 00. Nech b(9) = £e{T)-9 je vychýlenie (bias) odhadu T. Nech platí (i) systém hustôt {/(x, 9), ŕ? e íl} je regulárny, (ii) pre Vr? G íl existuje derivácia b'(9), (iii) Vr? G ^ /MT(x)dF(x, ŕ?) = JMT(x)^^dF(x, ŕ?). Potom pre Vr? G íl platí £e(T-ŕ?)J > 2^ [l + b'(9)}2 J{9) Dôkaz: teda Podlá (iii) b(0) = £0(T) - 0 = f T(x)dF(x,0)-0, J m b{9) + 9= í T(x)dF(x,0). J m |- / T(x)dF(x,0)= / T(x)£^dF(x,0) = 6'(0) + l. 76 Z podmienky d) regularity triedy hustôt {/(x, 9), 6 e íl} platí teda Podia Schwarzovej nerovnosti (T(x)-0)=£^dF(M) = 6'(0) + l. + 1]2< / (T(x) - ŕ?)2dF(x, ŕ Jm J m /'(x, /(x, ŕ?) 2 dF(x, —-^—KSeiT-e) . * [1 + b'(9)]2 Kedy nastáva rovnost-—-— £g{T — 9)2 ? Vo Schwarzovej nerovnosti nastáva rovnost práve vtedy J (9) ak (a) T (x) — ŕ? — 0 s. v. vzhíadom k Lebesgueovej-Stieltjesovej miere (ip, alebo ak (/3) 3K(6) nezávislá na x, že ^J) ' ^ = _ŕ4ľ((9)[T(x) — ŕ?] s.v. vzhíadom k Lebesgueovej-Stieltjesovej miere /(x, 0) V prípade (a) T (x) — ŕ? — 0, teda P{T(X) = 6} — 1 je T(X) diskrétna náhodná veličina ktorá nadobúda hodnotu 9 s pravdepodobnosťou 1, čiže £(T) — 9 a. b(ff) — 0. Samozrejme vtedy £(T — ô)2 — T)(T) — 0. [1 + b'(d)]2 1 Toto nemôže byt, lebo v uvažovanom prípade (a) podía dôkazu vety je £(T — ô)2 — -r—r-— —t—t > 0 J(9) J(6) (J(0) > 0 v regulárnej triede hustôt). [1 + b'(9)]2 Dostávame, že rovnost -—- — £$(T — 9)2 nastáva práve vtedy ak platí (/3), čiže 3K(9) nezávislá J (9) na x, že s.v. vzhiadom k Lebesgueovej-Stieltjesovej miere lá, p čo je to isté ako /(x, 9) d ln/(x, 9) = K{9)T{tí) - K{9)9, alebo 89 (17.6) J dlnfJ-*,^d9 = T(x) J K(9)d9 - J K(9)9d9. Ak označíme J K(9)d9 — Q(6) a J K(9)9d9 — R(9) tak (17.6) môžeme napísať ako ln/(x, 9) = Q(0)T(x) - R{9) + if (x). Keď ešte označíme C{9) — e~R^e\ u (x) — efi'x', tak dostávame pre hustotu /(x, ŕ?) /(x,ŕ?) = C(ŕ?)e«e)T(x) m (x). Definícia 17.6. Nech parametrický priestor íl je totožný s nejakou borelovskou množinou v Rm. Ak hustota /(x, 6) náhodného vektora X má tvar /(x, 0) = C(0)e^=i ^(e)^(x)ií(x), 77 kde C'(0), Q j (6) sú meratelné funkcie parametra 6 a 2} (x), u (x) sú meratelné funkcie premennej x, tak povieme, že /(x, 0) je hustota exponenciálneho typu. [1 + b'(9)]2 Poznámka. V Raovej-Cramerovej vete nastáva rovnost-—-— £g(T — 9)2 práve vtedy ak hustota náhodného vektora X je exponenciálneho typu. Definícia 17.7. Ak pre odhad T parametra 9 platí, že spĺňa všetky predpoklady Raovej-Cramerovej vety, čiže V ŕ? G íl je £e{T2) < oo a (i) systém hustôt {/(x, 9), ŕ? e íl} je regulárny, (ii) pre Vr? G íl existuje derivácia b'(6), (iii) V6 e íí ^/MT(x)dF(x,0) = JMT(x)fe^dF(x, (b(9) — £e{T) — 9 je vychýlenie (bias) odhadu T), potom tento odhad nazývame regulárny. Dôsledok. Pre každý regulárny nestranný odhad T parametra 9 platí V{T) > 1 m číslu —— sa hovorí dolná Raova-Cramerova hranica pre disperziu regulárneho nestranného odhadu. J (9) Definícia 17.8. Eŕicienciu (výdatnosť) e regulárneho nestranného odhadu T definujeme ako 1 Eŕiciencia sa dá písat aj ako V{T)J{6)' 1 J{ff) Pretože platí, že je V{T)J{9) V{T)' V^ * W) > °< čiže 0 < e < 1. Definícia 17.9. Ak pre odhad T je e — 1, tak tento odhad sa nazýva eŕicientnv (vydatný). Poznámka. Eŕiciencia je definovaná len pre regulárne nestranné odhady. Ak T nie je regulárny, môže sa stať, že formálne sa dá spočítat jeho eŕiciencia a vyjde e > 1 (pozri Cramer, H., Mathematical methods of statistics, Princeton, 1946, §32.3). Príklad 17.6. Nech Xi,Xn je náhodný výber z N(6, 1). Odhad T — X — i Eľ=i je nestranný, regulárny a eŕicientný odhad parametra 9. Dokážte. Riešenie: T = X = \ Y?i=\ xi, pričom Xi, ...,Xn sú nezávislé, teda£(T) = 9, V{T) = ±, £{T2) = 92+±. Združené rozdelenie X — (X1; ...,Xn)' má hustotu /(x, 9) — —T-e"5 2ľľ=i(2-'^e)2. Tento systém hustôt je (2?r) 2 regulárny (dokážte), dalej /'(x,0) = ^^ = f>-0)/(M), i=l 78 Y(xi ~ /(x,0)dx = -i 2 /(x, ŕ?) n n Ešte preverme podmienku (iii) Raovej-Cramerovej vety. Platí ;jTnT(x)dF(x,0) = ^(T(X)) = ^=l _9 96» T(x)££^dF(x, /CM) T(x)/'(x,0)dx: / (- í>)í>*-^)/(x^)dx = £{*w*-»))} Jr" \n i=1 J i=1 = n£[(X -6 + &){X - 9)] = n{D{X) + 6£(X - 0)} = = 1. Vidíme, že T = X je nestranný odhad ŕ?, regulárny a jeho disperzia je —, čo je ——. Je preto aj eŕicientný. n J(0) 18. Metóda maximálnej vierohodnosti a momentová metóda Popíšeme dve konkrétne cesty na odvodenie odhadu. Majme náhodný vektor X — (Xi,X2, ...,Xn)' a poznáme jeho hustotu p(x,0) (resp. v diskrétnom prípade pravděpodobnostmi funkciu (xm,pm(ý))mej)-Predpokladajme, že ŕ? G íl, kde íl je otvorený interval v R. Pri pevnej hodnote 0 je hustota p(x, 0) funkciou x. Pravda pre ľubovolné (pevné) x môžeme p(x, 0) (resp. P{X\ — x\, ...,Xn — xn; 0}) chápat ako funkciu parametra 0. Pre túto funkciu budeme používat označenie L (x, 0) a volat ju vierohodnostná funkcia (z anglického likelihood function). Samozrejme môžeme uvažovat aj funkciu náhodného vektora L (X, ŕ?) (ak napr. L(-, 0) je pre dané 0 meratelná funkcia, tak L (X, 0) je náhodná veličina). Definícia 18.1. Ak existuje 0* e íl, že pre všetky ŕ? e íl (18.1) L(X,0) < L(X,0*), potom hovoríme, že 0* je odhad parametra 0 získaný metódou maximálnej vierohodnosti (ML odhad). Analyzujme predchádzajúcu definíciu. Pre dané x vieme (často aj explicitne) nájsť 0*(x), ktoré maximalizuje L(x, 0). Teda takto máme určenú (niekedy aj explicitne) funkciu 0*(x). Ak ju chápeme ako funkciu náhodného vektora (9*(X), tak toto je ML odhad parametra 0. Jeho realizácia je 0*(x) (ak realizácia náhodného vektora X je x). Zrejme ak L(x, 0) (pri každom x) je dostatočne hladká funkcia 0 (napr. pre (9_L(x 0) každé x existuje ——), potom 0* nutne musí byť riešením rovnice (18.2) = 0. 0=0* de Ak položíme ln 0 — — oo, potom L(X, 0) < £<(X, 0*) bude platiť pre všetky 0 e íl práve vtedy ak V0eft lnL(X,0) < lnL(X,0*). 79 Teda v prípade dostatočne hladkej funkcie L môžeme písat rovnicu (18.2) ako (18.3) <91nL(X, 91np(X, 6=6'- de di(x, e) 6=6'- de = o 6=6'- Rovnicu (18.3) voláme vierohodnostná rovnica. Poznámka. Dôležitý pri úvahách okolo rovnice (18.3) je fakt, že íl je otvorený interval. Keby k íl patril jej krajný bod, mohlo by sa stat, že e* splňujúci (18.3) je práve v tomto bode. Vtedy ale e* nemusí byt koreňom (18.3). V dalšom sa ohraničíme na prípad, že X\,Xn je náhodný výber zo spojitého rozdelenia s hustotou /(•,#) (v diskrétnom prípade s pravdepodobnostnou funkciou (xm,pm)mej). Potom X — (X\, ...,Xn)' má hustotu p(x, 6) — f(xi, &)...f{xn, 6). Vierohodnostná rovnica (18.3) má preto tvar (18.4) (v diskrétnom prípade j^ľ=i E i=l dlaf(Xi de = 0 6=6'- d\npxt{e) de = 0). 6=6'- Poznámka. Dá sa dokázat, že za "rozumných predpokladov" existuje riešenie ne* — 6*{X\,Xn) vierohodnostnej rovnice (18.4), (vlastne postupnost riešení {™ŕ?*}n>i), ktoré je maximálne vierohodným odhadom. Tento odhad má velmi význačnú pravepodobnostnú vlastnost, a síce je konzistentným odhadom (teda podlá pravdepodobnosti ne* —> 9$, kde 6q je skutočná hodnota parametra 6) (pozri napr. Anděl, J., Základy matematické statistiky, MATFYZPRESS, Praha, 2005, §7.6). Navyše to je asymptoticky normálny vierohodný odhad, presnejšie ^-e°^N{°>jk)' (konvergencia v distribúcii). Pre praktické účely to znamená, že pri "dostatočne veľkom" n považujeme rozdelenie pravdepodobnosti náhodnej veličiny ne* za N \6q, —7/n A ). Pretože J(6o) nepoznáme, "nahrádzame" ho (blízkou) hodnotou nJ(0o), j(ne*). Príklad 18.1. Majme náhodný výber X — (X±,Xn) z binomického rozdelenia s paramtrami m (známym) a tt G (0,1). Parameter tt odhadujeme metódou maximálnej vierohodnosti. Náhodná veličina Xi,i G {1,2, ...,n} má pravdepodobnostnú funkciu {j,Pj)j=o,i,...,m, kde p j = (m)7rJ'(l - 7r)m-J. Vierohodnostná rovnica (18.4) má tvar E dhipxt (7t) dtr n d ln -E — tt=tt' i = l (™j^(i-^r-^ dtr E ln I x ) + X, hiTT + (m - Xi) ln(l - tt) dir [nX ln tt + n(m - X) ln(l - tt)] 80 ak X ^ 0, X ^ m. lahko sa presvedčíme, že ide o maximum, lebo d2l(X, 6) ôtt2 1 ;TlX 1 (1 -tt*)2 X m-X n(m — X) < 0. _tt*2 (l-^*)2. V prípade, že máme vektor parametrov 6 G íl C Rm, tak namiesto jednej vierohodnostnej rovnice (18.4) riešime sústavu vierohodnostnych rovníc (18.5) E i=l d]nf(Xi,0) de, 0, j = 1,2,..., m 9=9* (v diskrétnom prípade Eľ=i n 91npXi(9) 9=9* 0, .7 = 1,2,..., m). Aj v mnohorozmernom prípade parametra (7 — (7 majú ML odhady analogické vlastnosti ako v jednorozmernom prípade, bližšie pozri napr. v knihe Anděl, J., Základy matematické statistiky, MATFYZPRESS, Praha, 2005. Príklad 18.2. Majme náhodný výber X — (Xi,Xn)' z normálneho rozdelenia s parametrami /i a cr2, teda 8 — (/i, a2)' a priestor parametrov íl — R x (0,oo). Parametre odhadnime metódou maximálnej vierohodnosti. Hustota náhodnej veličiny Xi, i G {1, 2,n} je 1 V2TTC72 e 2 a sústava vierohodnostnych rovníc (18.5) je ^ln(2^2)--ÍI^(Xí-M)2 d der2 i=l d_ d/j, 1 " ln(27r<72) - —2 Y^(Xi - m)5 Teda (18.6) (18.7) n 1 --ô2tt , 2 27Tcr*2 2 = o = o. i=l 1 " Z (18.7) dostávame, že fŕ — i Eľ=i ^ = ^ ä po dosadení do (18.6) máme cr*2 = ^ Eľ=i(^i ~~ -^0' Dokážme ešte, že pre všetky (/i, cr2)' G íl — R x (0, oo) je ž(X,M,cr2) <ž(X,M*,cr*2), čiže pre každú realizáciu x náhodného vektora X je ž(x,/i,cr2) < ž(x,X,S*2), kde x je realizácia /i* — X a s*2 je realizácia cr*2 — i Eľ=i(^í ~~ X)2. Upravujme n n 1 ™ Z(x, M, t2) = -| ln(27r) - | ln(cr2) - — ^[(x, - x) + (x - M)]2 = i=l 81 ^ ( n n n \ — I ^2(xi - ž)2 + 2^(x4 - x)(x - n) + J^(x - /j,)2 > — 11 li=l i=l i=l J a2) - |E(^í-^)2 +n(x- m)2| = -|ln(27r)-|lii(0- (18.8) n n 2 ns*2 + n(x - y«)2 = --ln(27r)- -ln((72)-- 2<72 Samozrejme ž(x,x,S*2) = -;in(2^)- Jln(S*2)-;. Preto pre každú realizáciu x je Z(x,x, s* ) - l(yi,fi,c72) = - a1 j a1 (x - n)2 >0, lebo pre všetky kladné čísla t — je y (í) = í — 1— Iní > 0. (Funkcia y(í) nadobúda pre kladné t minimum v bode t — 1, pričom y(l) = 0.) Teraz si popíšeme relatívne najjednoduchšiu metódu získania odhadu - momentovú metódu. Nech X — (Xi,Xn)' je náhodný výber z rozdelenia, ktoré závisí od 9 — {6\,9m)'■ Nech pre všetky 9 e íl existujú momenty n'k = £{X*), k = 1,2,..., m. Samozrejme tieto momenty tiež závisia od 9, čiže n'k — n'k(0). Výberové momenty sú 1 " M'k = -Y,Xt k = 1,2,.... i=l Momentová metóda odhadu 9 spočíva v tom, že (momentový) odhad 9 je riešením rovníc (18.9) n'k{9) = M'k, k =1,2,..., m. Niekedy sa môže stat, že m rovníc (18.9) nestačí k (jednoznačnému) určeniu 9. Potom sa obyčajne vezmú dalšie rovnice n'k(0) — Mk, k — m + 1,... (samozrejme príslušné teoretické momenty n'k musia existovat). Podia Chinčinovej vety (Veta 13.2.) M'k konvergujú podlá pravdepodobnosti k (i'k. Tento fakt spolu s inými limitnými vetami obyčajne umožňuje v konkrétnom prípade dokázat konzistenciu odhadov získaných momentovou metódou. 1 Príklad 18.3. Majme náhodný výber Xll X2, ...,Xn z exponenciálneho rozdelenia s /(x, 9) — —e o pre x > 0 a /(x, 9) — 0 pre x < 0. Platí MÍ(0) = 0> M[=X, teda dostávame odhad parametra 9 momentovou metódou 0 = X. 82 19. Bodové a intervalové odhady parametrov normálneho rozdelenia Najprv si dokážme dve tvrdenia: Veta 19.1. Nech náhodný vektor X — (X1; ...,Xn)' ~ N(fi, E), pričom S je pozitívne deŕinitná matica (regulárna). (Teda X má regulárne normálne rozdelenie.) Ak B„„ je regulárna matica a a G R™, tak náhodný vektor Y = a + BX ~ N (a. + BX, BSB'). Dôkaz: Použijeme Vetu 9.4 (o hustote transformovaného náhodného vektora). Hustota náhodného vektora X je /x (x) = (27r)-t(detS)-5e-5(x-M)'s-1(x-M)^ Inverzné zobrazenie k h : h(x) = a+Bx je h_1(y) — B_1(y—a) a Jakobián Dh-i (y) = det 9gy, =detB-1. Preto hustota náhodného vektora Y — a + BX je /Y(y) = /x(B-1(y-a))|detB-1| = = (2^)-t(detS)-5|detBr1e-^B"(y-a)-^'s"(B"(y-a)-^ = = (27r)-7(det(BSB'))-'e-'(y-a-B'i)'(BSB')"1(y-a-B'i), čo je hustota N (a + B/x, BSB'). * Veta 19.2. Nech Xi,...,Xn sú nezávislé, Xi ~ N(/j,í, cr2), z = 1,2, ...,n. B je ortonormálna n x n matica. Položme X = (Xi,X„)' a Y = (Yi,Y„)' = B(X — /x), kde fi — (/ii,/i„)'. Potom Yi,Y„ sú nezávislé a ľ,- ~ ^(0, cr2), j — 1, 2,n. Dôkaz: Pretože X±,X„ sú nezávislé, Xi ~ N(/ii, cr2), 2 = 1,n, má X hustotu /x(x) = TT 1 e-K^)2 = (2.cr2)-f e-^-í^)2, , V27TCr čo je hustota N(fi,(72T). Ak je B ortonormálna (teda BB' = B'B = I), tak z Vety 19.1 plynie, že Y — B(X — fi) ~ X(0, cr2I) a preto má Y hustotu /Y(y) = ;Q-_- e-K^)2=rj/yi(yí). * 2 — 1 V 2 — 1 Teraz si dokážme nasledujúcu vetu: Veta 19.3 Majme Xi,X„ náhodný výber z rozdelenia ./V(/z, cr2). Pre výberový priemer X — ^ Yľi=i Xi a výberový rozptyl S2 — Eľ=i(Xí ~ X)2 Platí (i) X~X(M,^); (ii) ^S2~X2_i; (iii) ak je n > 1, tak sú náhodné veličiny X a. S2 nezávislé. Dôkaz: Uvažujme ortonormálnu maticu B (Helmertova matica) 83 (přesvědčte sa, že je ortonormálna). Podia Vety 19.2 je Y — (Yí,Yn)' — B(X —/x) ~ N(0, ct2I), (tentokrát /x — (/i, a teda Yí ~ -/V(0,ct2) z = 1, ...,n sú združené nezávislé. Počítajme n (19.1) Y'Y = (X - /x)'B'B(X — /x) = (X — /x)'(X - /x) = ]T(^ - M)2, i=l 1 " 1 — — (19.2) ^ = bi (X - /x) = — V (X, - /x) = -7=(nX - nM) = Vn"(X - /i), -v/n —~ wn V 2 — 1 v n n (19.3) - X)2 = ^[(X, -y)-(X- m)]2 = 2 = 1 2 = 1 = ^(X, - M)2 - 2(X - n) ^(Xi - m) + n(X - m)2 = Y'Y - n(X - M)2 = i=l i=l n n i=l i=2 ^1 Z (19.2) dostávame X = ^ + /x a podlá Príkladu 9.2 (alebo Vety 19.1 pre n = 1) je X - AT (/z, ^-). Podlá 2 (19.3) je I^21-S'2 = ^2 E™=i(^í — X)2 = Yľj=2 í 1F ) a Je teda súčtom mocnín nezávislých náhodných veličín pričom každá z nich má X(0,1) rozdelenie. Preto ^^r-S2 ~ Xn-i- Pretože Yí,Y^ sú nezávislé sú aj X^-jk+V&S2^^ Eľ=2 V2 nezávislé. * K zostrojeniu bodových a intervalových odhadov parametrov normálneho rozdelenia budeme okrem náhodných veličín (štatistík) X a. S2 potřebovat ešte štatistiky tt x ~ fJ' r t X — fj, r U —-\Jn a 1 — —-—\Jn. a b Veta 19.4 Majme Xi,...,X„ náhodný výber z rozdelenia N (/i, u2). Nech X — ± Eľ=i Je výberový priemer a S2 — ^-j- Eľ=i(^ ~~ X)2 výberový rozptyl. Platí (i) tf= ^v^-AW), (ii) T = Xg^\/n ~ ín-i (Studentovo í rozdelenie s n — 1 stupňami volnosti). Dôkaz: Pretože podlá Vety 19.3 X - N(ix, podlá Príkladu 9.2 (alebo Vety 19.1) má U = X^ -^ - X(0,1) rozdelenie. Podlá predchádzajúcej vety sú X a Ä2 nezávislé, preto aj U a I^"S'2 sú nezávislé, pričom ^^rS2 ~ Xn-i-Náhodná veličina _ n—1 y n—1 má Studentovo í„_i rozdelenie. £ Veta 19.5 Majme Xi,X„ náhodný výber z rozdelenia N(n, c2), kde /i je neznámy parameter (stredná hodnota) a a2 známe kladné číslo. Potom (19.4) (x-u^X + u^JL je 100(1 — a)%—ný interval spoľahlivosti pre strednú hodnotu \x pri známom a2 (i*i--| je (1 — ^) kvantil X(0,1) rozdelenia (tabulkovaná hodnota)). 84 Dôkaz: Pretože U = XfhVn~ ~ -^(0,1), platí 7-ir X — m /— t 1 - a = P{Mf < -V« < "i-aj = 2 (7 2 ^ yn 2 yn (lebo as = * Interval (19.4) je náhodný interval s pevnou dĺžkou (jeho krajné hodnoty sú náhodné premenné). Chápat ho treba (frekventisticky) tak, že ak by sme realizovali napr. M—krát nezávisle náhodný výber rozsahu n z N(fj,, cr2) rozdelenia (pritom a2 poznáme a /i je vždy rovnaké), tak "približne" j^(l — a) realizácií pokryje skutočnú neznámu hodnotu /i (teda 100(1 — a)% z týchto realizácií pokryje /i). Veta 19.6 Majme X±,Xn náhodný výber z rozdelenia N(/i, c2), kde \x ani a2 nepoznáme. Potom je 100(1 — a)%—ný interval spolahlivosti pre strednú hodnotu /j, pri neznámom a2 (t„_i(l — |-) je (1 — §) kvantil Študentovho í„_i rozdelenia) a (19.6) / í""1^ í""1^ xLi(i-f)' xLi(f) je 100(1 — a)%—ný interval spolahlivosti pre rozptyl cr2 (Xn-iO- ~ §) Je (1 ~~ f) kvantil x«-i rozdelenia) Dôkaz: Pretože T — x?p\/n ~ í„_i, platí / q! n X — u 1-a = *„_!(-) < —^ V^<ín-l(l-|)} Vzhladom na to, že i^3iS' ~ Xíí-i, zase platí l-a = P^_1(|) SY ~ XnY-i m^ náhodná veličina X -Y -(nx - Hy) j nxnY nX -5| + = ■![(„* - 1)# + (nY í)S2y] ~ xL+^-2 ,2 (vyplýva to napr. z definície % rozdelenia) a je nezávislá s Ux-_y. Potom ale -L[(„x-l)S|+(„y-l)Sf,] /-L[(«x-l)5|+(«y-l)5|.] (nx-l)5^ + (ny-l)5f. \j nx +nY nx+nY—2 _ X - Y - (/ix - Hy) j nxnY (iii) ľahko vidíme, že TX-y ~ tnx+nY-2- nx-l c2 nx - 1 _ _ p p ny-l c2 — q2 „2 ~r ~r"í-tní —-2— Dy oy ox ny — 1 Teraz už lahko dokážeme nasledujúcu vetu Veta 19.8 Majme X±,Xnx náhodný výber z rozdelenia N(iix, it|), X je jeho výberový priemer a jeho výberový rozptyl, dalej majme Y±, ...,YnY náhodný výber z rozdelenia N(/iy, uY), Y je jeho výberový priemer a S y jeho výberový rozptyl. Predpokladajme, že oba výbery sú nezávislé. Potom (i) ak sú a2x a aY známe, tak 100(1 — a)% interval spoľahlivosti pre nx — [iy je Ui- (ii) ak sú a2x a aY neznáme, ale platí a2x — aY — a2, tak 100(1 — a)% interval spoľahlivosti pre \xx — [íy je X — Y — tnx+nY-2(l — 7ľ) 2 V nx + nY — 2 y n^ny a, I (nx — ^)S2X + (ny — \)SY jnx + nY 86 a, / (nx - 1)S% + (ny - 1)SY lnx + nY X — Y + tnx+ny-2(l - —) 0 2 y nx + ny — 2 y nxny a2 (iii) ak sú /ix, /iy, c^, Oy- neznáme, tak 100(1 — a)% interval spolahlivosti pre -^f je S2x 1 ^ 1 >Sy -l,iiy — 1 (1 2) — l,roy — 1 ( 2 ) (Fnx-i,nY-i(l - f) je (1 - f) kvantil .F„x_i,„y_i rozdelenia). Dôkaz: Spravte ako cvičenie, využite štatistiky z Vety 19.7. Ešte pre úplnost si uvedieme bez dôkazu interval spolahlivosti pre rozdiel stredných hodnôt u tzv. párových výberov. Veta 19.9. Nech Xi — (Xi,Yi)', ...,X„ — (Xn,Yn)' je náhodný výber z dvojrozmerného normálneho rozdelenia N((jl, S) s paramertami fi — (/ix,/iy)' a S = x ^ X Y J, pričom G R, crx > \Q(TxOY vY J 0, 0, í? e (0,1). Prei = l,2,...,noznačmeZi = Xi-yi, ^=^Eľ=i^. SI = Eľ=i(^ -^)2-Potom Ž~tn-i(l f )%,Ž + Í„_1(1 - ^)% 2 y/n 2 je 100(1 — a)%—ný interval spolahlivosti pre /ix — /iy. Niekedy sa takémuto intervalu spolahlivosti hovorí aj intervalový odhad jix — Hy ° spolahlivosti (1 — a). 20. Testovanie hypotéz Ukážeme si, v čom spočíva (v matematickej štatistike) podstata testovania hypotéz. Myslíme tým štatistické testovanie hypotéz, niekedy tiež hovoríme o testovaní štatistických hypotéz. Majme náhodný výber X — (X±, ...,Xn)', pričom nevieme, ci pochádza z rozdelenia N(/iQ,a2) alebo z N(ni,cr2), poznáme /z0,Mi; (Mo ^ Mi) aJ íj2- Máme hypotézu (tzv. nulovú hypotézu) H0: výber pochádza z rozdelenia N(/i0, a2) Tzv. alternatívna hypotéza (konkurujúca) je Hi: výber pochádza z rozdelenia N(/j,i, c2) Rozhodnutie bude také, že platnost Hq nezamietneme alebo zamietneme. Pri rozhodovaní o platnosti Hq alebo H\ sa môžeme dopustit jednej z dvoch chýb. (i) Ak zamietneme H0, hoci ona platí (je správna), urobíme tzv. chybu prvého druhu. (ii) Ak nezamietneme Hq, hoci nie je správna (t.j. platí iíi), urobíme chybu druhého druhu. Svoje rozhodovanie založíme na realizácii x — (x\, x2,xn)' náhodného výberu X. Preto bude "ovplyvnené" náhodou. Prirodzene požadujeme, aby rozhodovacie pravidlo, podlá ktorého zamietneme alebo nezamietneme Hq bolo také, aby pravdepodobnosti oboch chýb boli čo najmenšie. Ked rozsah náhodného výberu n je pevne určený, nedajú sa pravdepodobnosti oboch horeuvedených chýb súčasne urobit takými malými, ako by sme si priali. Zaužívalo sa trvat na požiadavke, aby pravděpodobnost chyby prvého druhu bola rovná a, kde a je vopred zvolené číslo z intervalu (0,1). V praxi sa ukázalo vhodné volit a G {0,1; 0, 05; 0, 01}. číslu a sa hovorí hladina významnosti testu. Pravděpodobnost chyby druhého druhu označme j3. 87 Štatistické rozhodovanie prebieha tak, že sa dopredu určí tzv. kritický obor (kritická oblast) W (g R"), t.j. množina realizácií x, pri ktorých budeme Hq zamietať. Teda ak sa realizuje x g W, tak Hq zamietneme. Tvar kritického oboru stanovujeme tak, aby za platnosti Hq padla realizácia x do kritického oboru "zriedka", ale za platnosti Hi tam padla "čo najčastejšie". Veľkosť kritického oboru volíme tak, aby sme platnú H0 zamietali s pravdepodobnosťou a. Na testovanie (rozhodovanie) použijeme "vhodnú" štatistiku T — T(X), ktorú nazývame testovacia štatistika. V takom prípade popíšeme kritickú oblasť ako množinu T(W). Teda Hq zamietneme, ak T (x) g T(W). Vráťme sa k testovaniu Hq: výber pochádza z rozdelenia N(/iq, a2) oproti alternatívnej hypotéze H±: výber pochádza z rozdelenia N(ni, a2). Použijeme testovaciu štatistiku T (X) — X — E™=i xi- Vieme, že (v našom prípade) za platnosti Hq bude X ~ N(hq, ^-), teda realizácie x budú (pri dosť veľkom n) blízo /iq. Navrhneme také rozhodovacie (testovacie) pravidlo, že ak \x — /io| > k, tak zamietneme Hq. Teda "tvar" kritickej oblasti je {x : x g (—oo, /i0 — k) U (/io + k, oo)}. "Veľkosť" kritickej oblasti (teda číslo &) volíme tak, aby pravdepodobnosť chyby prvého druhu bola a, teda aby realizácia x padla do kritickej oblasti za platnosti Hq s pravdepodobnosťou a. Inými slovami chceme aby P{\X-fi0\ >k} = a, pričom X ~ N(hq, ^-). Zrejme —!= a a —i= a Pretože - ^(0,1), je zrejmé, že —y/n — iíi_«. Kritická oblasť testu H0 oproti Hi s hladinou významnosti a (pri použití testovacej štatistiky X) je Wa — {x : \x — /zqI > iíi_»-p}. 2 y/n Treba si všimnúť, že nezamietnutie Hq neznamená, že Hq je správna. K tomu, aby sme považovali Hq za správnu, potrebovali by sme mať ešte záruku, že j3 je dosť malé. Potom by sme mohli hovoriť, že H0 prijímame. Testovať Hq na hladine významnosti a len zaručuje, že zamietnutie nulovej hypotézy, hoci je správna nastane s pravdepodobnosťou a. V sledovanom príklade sme mali tzv. jednoduchú hypotézu H0 - testovaný parameter (stredná hodnota) v prípade platnosti Hq mohol nadobudnúť len jednu hodnotu, a síce /iq. Aj alternatíva H\ bola jednoduchá. Pri testovaní hypotéz obyčajne predpokladáme, že parameter rozdelenia pravdepodobnosti náhodného výberu X je 6 — (6\,9m)' g © c Rm, kde © je parametrický priestor - otvorená a neprázdna množina, ©o c © a©i = © ©o sú dve "konkurujúce si" možiny. H0 : 6 E ®0 a ífi :0G © ©o- Pretože H0 aj Hi nie sú vo všeobecnosti jednoduché, hladina významnosti testu s kritickou oblasťou W je sup Pe(X.eW). e e ©o Tiež sa uvažuje sa funkcia 13(9) — Pg(X. g W), 9 g ©. Volá sa silofunkcia testu s kritickou oblasťou W. Niekedy sa pracuje s funkciou 1 — /3(8), ktorá sa volá operačná charakteristika testu. Ak je Hi jednoduchá, (teda Hi : 9 — 01; tak 1 — /3((9i) sa volá sila testu. Prehľad niektorých vybraných testov pre jeden náhodný výber X z N(/i, a2) rozdelenia (x je realizácia X a s2 je realizácia S2): 88 Ho M = Mo Hl M 7^ Mo WQ = {x : |ič—/zo|\/^ — ^í-f} ít2 je známe Ho M = Mo Hl M > Mo M^q, = {x : (x — Ho)^/n > sí„_i(l — t|)} c2 neznáme Ho M = Mo Hi M > Mo Wq = {x : (x — Ho)^/n > st„_i(l — a)} cr2 neznáme Ho M = Mo Hi M < Mo Wq = {x : (x — Ho)^/n < — sí„_i(l — a)} c2 neznáme Ho a2. = <7§ Hi WQ = {x : ^s2 £ (x2_i(f ),X2-i(l - f))} M neznáme Ho a2. = <7§ Hi : (J2 > a2 Wa — {x : -^y^s2 > Xn-i(l ~~ a)} M neznáme Ho a2. = *§ Hi : a2 < a2 Wq = {x : (-"^1-)g2 < x2, i(a)} /i neznáme Prehlad niektorých vybraných testov v prípade dvoch nezávislých náhodných výberov, a síce X — (X±,Xnx)' z N{nx, crx) s výberovým priemerom X a výberovým rozptylom Sx a Y = (Yí, YnY)' z a ty 2 \ 'U V 'U 4- 1 C2 o2 _ í)5* + _ - /-\ iv(/iy,(7yj s výberovým priemerom r a výberovým rozptylom 5y, i>j^y —---, x [y) je realizácia X (Y), s2x (sY) je realizácia Sx (SY) a s^y je realizácia SXY. H0 : = Hi : ^x Vy Wa = {(x', y')' : |x - y \ > u1_fxj^ + ^} a2x — Oy neznáme Ho ■ Hx — Vy Hi : fj,x fiy _ Wa = {(x', y')' :\x-y\> tnx+nY-2(l - f )sxyxJ^x^} Hx, [íy neznáme H0 : a2x = íjy Hi : cr| ^ crf, T^Q = {(x', y')' : fŕ £ (P„x-i,^-i(f), P„x-i,^-i(l - f))} Poznámka. Namiesto hladiny významnosti a bežný štatistický softvér (STATISTICA, S+, SAS) udáva dosiahnutú hladinu (anglicky P—value, signifícance value, signifícance leveľ). Je to najmenšia hladina významnosti testu, pri ktorej by sme (pri danej realizácii testovacej štatistiky) hypotézu Ho ešte zamietli. Vyjadruje pravděpodobnost spočítanú za platnosti nulovej hypotézy, že dostaneme práve našu realizáciu alebo realizáciu ešte viac odporujúcu testovanej hypotéze. Pri "vyberaní" vhodného testu postupujeme tak, že medzi testami na (požadovanej) hladine významnosti a sa snažíme zvolit test s čo najmenšou pravdepodobnosťou chyby druhého druhu. To ale ukazuje práve funkcia P(6). Obom požiadavkám sa (niekedy) dá vyhovieť v jednoduchom prípade, a síce ak máme jednoduchú hypotézu Ho : 0 — 60 oproti jednoduchej alternatíve Hi : 6 — 6^. Hovorí o tom nasledujúca veta. Veta 20.1. (Neymanova-Pearsonova lema) Majme náhodný vektor X — (Xi, ...,Xn)' s hustotou /(x, 0). Nech k danému a G (0,1) existuje také c > 0, že pre množinu (20.1) Wc = {x: /(x, 00 >c/(x,0o)} platí (20.2) í /(x,0o)dx = Potom pre každú meratelnú množinu W takú, že f /(x,0o)dx = 89 platí (20.3) / /(x.eodx^ / /(x.eodx. ■Jwc Jw Dôkaz: Množiny W a Wc sa môžu napísat ako w — (w — wc) u (w n tyc), tyc = (tyc — w) u (ty n wc). Počítajme teraz f /(x.OOdx- / /(X,0!)dx = = / f(x,o1)dx+ f /(x.eodx--/ /(x.eodx- / /(x.eodx^ >c/ f(x.,0o)dx-c /(x, 0o)cbí = = c/ /(x, 0o)dx + c / /(x,0o)dx- -c/ f(x.,0o)dx-c /(x, 0o)d,Tí = Jw-wc JwnWc z j f(x.,0o)dx. — c j f(xL,0o)dxL = ca — ca = O, Jw, Jw lebo na množine TYC — TY je / /(x^dx^cí /(x,0o)dx a mimo množiny TYC je / /(x, OOdx < c /" /(x,0o)dx, čiže / /(x,0i)dx> -c / f(x,0o)dx. * Veta 20.1. teda tvrdí, že ak máme testovat jednoduchú hypotézu oproti jednoduchej alternatíve a sú splnené podmienky (20.1) a (20.2), tak test s kritickou oblastou TYC má hladinu významnosti a a pre akýkolvek test s hladinou významnosti a je podlá (20.3) sila testu s kritickou oblastou TYC väčšia. Test s kritickou oblastou TYC je najsilnejší možný medzi všetkými testami s hladinou významnosti a. Príklad 20.1. Majme náhodný výber X — (Xi,Xn)' z rozdelenia N(n, c2), pričom a2 poznáme. Nájdite najsilnejší test nulovej hupotézy Hq : /i — /íq oproti alternatívnej hypotéze H\ : /i — /ii, kde Mo < Mi- Riešenie: Pretože /(x,/i,cr2) = (2^cr2)-te-i^5:-i(a'*^)2, je kritický obor z Neymanovej-Pearsonovej lemy Wr = U: feiíli^l = e-^ÍEľ^^-MO^-Eľ^^-Mo)2 > c /(x,/i0,cH) 90 teda Úpravou dostávame Wc = |x : ^ - ii0)2 - l^i)2^j > lnc| 2cr2 Wc = <{ x : 2x(/íi - no) - (nf - nl) > -ln c n j2 Wc=L: x>^±^ + —-£--lne {_ i£l+i£0 I__2f_lnr— //n (7 (7 (20.4) Wc = <^ x : -y/n > —--yjn +-- L cr 2cr Vn(Mi-Mo) Treba nám ešte určit c. Jeho hodnotu spočítame z podmienky a= / /(x^^x^P^Xe Wc) = PMt>: X(w) G Wc} ■Jwc X(lo) -hq r Mi - Mo a- , cr ln < = P < lú : -Vra > —--v n 1 2cr V™(Mi - Mo) Pretože ~ A^(0,1), dostávame, že Hi — Ho /— cr ln c ííl-a, 2(7 \/ň(^i - /i0) cize 2v/ň(/zi - Htsjvui-a - n((ii - fip)2 c=e 2a2 Jednoduchšie určenie Wc je z (20.4) f x — /io ^- 1 f _ (7 Wc = < x : -vn > Ui_Q > = < x : x > /íq + Wi_q—f= l °- JI V™ Poznámka. Podobne by sme v prípade hladania najsilnejšieho testu nulovej hupotézy Po : M — Mo oproti alternatívnej hypotéze H\ : /i — /ii, ked /io > /ii odvodili, že v tomto prípade Po zamietame na hladine významnosti a ak Urobte ako cvičenie. DODATOK Platí I 22 \/7t b / (cos bx)e~a x dx —-e~^, a > 0, Jo 2« °° COS foc 7t _|b| o l + x2 2 o 2a 2 r (2±i) v 2 7 a > 0,n > -1. Dôkazy nájdete v učebnici matematickej analýzy.