Obsah 1. Popisná statistika.3 2. Číselné charakteristiky znaků. 46 3. Regresní analýza. Počet Pravděpodobnosti. 98 4. Diskrétní pravděpodobnost. Stochasticky nezávisléjevy. 139 5. Podmíněná pravděpodobnost. Geometrická pravděpodobnost. 163 6. Statistický software. Vizualizace dat. 186 7. Náhodnéveličiny (NV). 234 8. Diskrétní a spojité NV. 255 9. Stochasticky nezávislé NV. Vybraná rozložení. 279 10. Rozložení transformovaných NV. Číselné charakteristiky NV. 322 11. Vlastnosti číselných charakteristik NV. 352 12. Slabý zákon velkých čísel a centrální limitnívěta. 370 13. Statistické tabulky. 383 1. Popisná statistika Popisná statistika je disciplína, která popisuje a sumarizuje informace obsažené ve velkém množství dat pomocí tabulek, grafů, funkcionálních a číselných charakteristik. Činí tak pomocí základních matematických operací. Cílem popisné statistiky je zpřehlednit informace „ukryté'" v datových souborech. Popisná statistika je velmi důležitá minimálně ze dvou důvodů: - v praxi se často používá (všichni znají takové pojmy, jako je průměr, směrodatná odchylka, tabulka rozložení četností, výsečový graf apod.) - motivuje pojmy, se kterými pak pracuje počet pravděpodobnosti (např. relativní četnost motivuje pravděpodobnost, hustota četnosti motivuje hustotu pravděpodobnosti, průměr motivuje střední hodnotu apod.) Dobré pochopení pojmů popisné statistiky tedy velmi usnadní studium počtu pravděpodobnosti. 3 Základní, výběrový a datový soubor Základním souborem rozumíme libovolnou neprázdnou množinu E. Prvky množiny E značíme s a nazýváme je objekty. Libovolnou neprázdnou podmnožinu [sl9...,en} základního souboru E nazýváme výběrový soubor rozsahu n. Je-li množina G í E, pak symbolem N(G) rozumíme absolutní četnost množiny G ve výběrovém souboru, tj. počet těch objektů množiny G, které patří do výběrového souboru. Relativní četnost množiny G ve výběrovém souboru zavedeme vztahem p(G) = N(G). n Ilustrace 4 Příklad Příklad: Základním souborem E je množina všech ekonomicky zaměřených studentů 1. ročníku českých vysokých škol. Množina Gi je tvořena těmi studenty, kteří uspěli v prvním zkušebním termínu z matematiky a množina G2 obsahuje ty studenty, kteří uspěli v prvním zkušebním termínu z angličtiny. Ze základního souboru bylo náhodně vybráno 20 studentů, kteří tvoří výběrový soubor {s1, s20}. Z těchto 20 studentů 12 uspělo v matematice, 15 v angličtině a 11 v obou předmětech. Zapište absolutní a relativní četnosti úspěšných matematiků, angličtinářů a oboustranně úspěšných studentů. Řešení: N(G1) = 12,N(G2) = 15,N(G1 n G2) = 11, n = 20,p(G^ = 20 = 0,6, p^) = 20 = 0,75, p(G, nG2) =— = 0,55 Vidíme, že úspěšných matematiků je 60%, angličtinářů 75% a oboustranně úspěšných studentů jen 55%. 5 Relativní četnost Vlastnosti relativní četnosti: Relativní četnost má následujících 12 vlastností, které jsou obdobné vlastnostem procent. • p( 0) = 0 • p(G) > 0 (nezápornost) • p(G) < 1 • p(Gi u G2) + p(Gi n G2) = p(Gi) + p(G2) • 1 + p(Gi n G2) > p(Gi) + p(G2) • p(Gi u G2) + 0 < p(Gi) + p(G2) (subaditivita) • Gi n G2 = 0 => p(Gi u G2) = p(Gi) + p(G2) (aditivita) • p(G2 \ Gi) = p(G2) - p(Gi n G2) • Gi í G2 p(G2 \ Gi) = p(G2) - p(Gi) (subtraktivita) • Gi í G2 p(Gi) < p(G2) (monotonie) • p(E) = i (normovanost) • p(G) + p(G) = i (komplementarita) 6 Podmíněná relativní četnost Pokud se v daném základním souboru zajímáme o dvě podmnožiny, můžeme zavést pojem podmíněné relativní četnosti jedné podmnožiny v daném výběrovém souboru za předpokladu, že objekt pocházíz druhémnožiny. Nechť E je základní soubor, G1, G2 jeho podmnožiny,-^,..., en} vý-běrovýsoubor. Definujeme podmíněnou relativní četnostmnožiny Gi ve výběrovém souboru za předpokladu G2: p(Gi/G2) = N(G^)= P*^) a ťV 1 2 N (G2) p(G2) podmíněnou relativní četnostG2ve výběrovém souboru za předpokla-duG1: N(G1 n G2 )= p(G1 n G2) p(G2/Gi) N (Gi) p(Gi) 7 Příklad Příklad: Pro údaje z příkladu o studentech vypočtěte podmíněnou relativní četnost úspěšných matematiků mezi úspěšnými angličtináři a podmíněnou relativní četnost úspěšných angličtinářů mezi úspěšnými matematiky. (Připomínáme, že z 20 studentů 12 uspělo v matematice, 15 v angličtině a 11 v obou předmětech.) Řešení: N(G1) = 12,N(G2) = 15,N(G1 n G2) = 11, n = 20, p(G1/G2) = N fa^2 * = = 0,73 (tzn., že 73% těch studentů, kteří byli úspěšní v angličtině, uspělo i v matematice) p(G2/G1) = N (N(G?G 2 * =11= 0,92 (tzn., že 92% těch studentů, kteří byli úspěšní v matematice, uspělo i v angličtině) 8 Cetnostní nezávislost Pojem četnostní nezávislosti dvou množin: O četnostní nezávislosti dvou množin v daném výběrovém souboru hovoříme tehdy, když informace o původu objektu z jedné množiny nijak nemění šance, s nimiž soudíme na jeho původ i z druhé množiny. V příkladě se studenty by množiny úspěšných matematiků a úspěšných angličtinářů byly četnostně nezávislé, pokud podíl úspěšných matematiků mezi úspěšnými angličtinári by byl stejný jako podíl úspěšných matematiků mezi všemi zkoušenými studenty a stejně tak podíl úspěšných angličtinářů mezi úspěšnými matematiky by byl stejný jako podíl úspěšných angličtinářů mezi všemi zkoušenými studenty, tj. n (G, n G2) = n (G,) n n G2) = n (G2) n(G2) ~ n A n(Gj) = n ' Po snadné úpravě dostaneme multiplikativní vztah n(Gin,G1) = „(^,, tj. p(G, nG2) = p(G,)p(G2) n n n Řekneme tedy, že množiny Gi, G2 jsou četnostně nezávislé v daném výběrovém souboru, jestliže p(G1 n g2 ) = p(G1 )p(G2). (V praxi jen zřídka dojde k tomu, že uvedený vztah platí přesně. Většinou je jen naznačena určitá tendence četnostní nezávislosti.) 9 Příklad Příklad: Pro údaje z příkladu o studentech zjistěte, zda úspěchy v matematice a angličtině jsou v daném výběrovém souboru četnostně nezávislé. (Připomínáme, že oboustranně úspěšných studentů bylo 55%, úspěšných matematiků 60% a úspěšných angličtinářů 75%.) Řešení: p(Gi n G2) = 0,55, p(Gi)p(G2) = 0,6x0,75 = 0,45, tedy skutečná relativní četnost oboustranně úspěšných studentů je větší než by odpovídalo četnostní nezávislosti množin G1, G2 v daném výběrovém souboru. Znamená to, že úspěch v matematice se zpravidla sdružuje s úspěchem v angličtině a naopak. 10 Skalární a vektorový znak Pojem skalárního a vektorového znaku: Vlastnosti objektů vyjadřujeme číselně pomocí znaků. Nechť E je základní soubor. Funkce X: E —> R, Y: E —> R, Z: E —> R, které každému objektu přiřazují číslo, se nazývají (skalární) znaky. Uspořádaná p-tice (X, Y, Z) se nazývá vektorový znak. r W) Stí) £ Označení: Nechť je dán výběrový soubor (s1? sn} c E. Hodnoty znaků X, Y, Z pro i-tý objekt označíme xi = X(si), yi = Y(si), zi = Z(si), i = 1, n. 11 Datový soubor Pojem datového souboru: x1 y1 x2 y2 Matice z \ typu n x p se nazývá datový soubor. Její řádky nJ odpovídají jednotlivým objektům, sloupce znakům. Libovolný sloupec této matice nazýváme jednorozměrným datovým souborem. Jestliže uspořádáme hodnoty některého znaku (např. znaku X) v jednorozměrném datovém souboru vzestupně podle velikosti, do- staneme uspořádaný datový soubor x x(i) Vx(n) J kde x(i) < x(2) < ... < x(n). Vektor x x[i] Vx[r]J kde X[ [i] < ... < x[r] jsou navzájem různé hodnoty znaku X, se nazývá vektor variant. 12 Příklad Příklad: Pro studenty z výběrového souboru uvedeného výše byly zjišťovány hodnoty znaků X - známka z matematiky v prvním zkušebním termínu, Y -známka z angličtiny v prvním zkušebním termínu, Z - pohlaví studenta (0 ... žena, 1 ... muž). Byl získán datový soubor 2 3 3 1 2 4 3 3 1 3 4 0 1 1 2 4 2 3 4 1 4 4 vl 231 31 41 3 00 Utvořte jednorozměrný uspořádaný i neuspořádaný datový soubor pro známky z matematiky a vektorvariant pro známky z matematiky. Řešení: (2 (A i 1 4 1 1 1 1 1 4 1 3 1 3 2 1 2 1 2 4 3 4 3 2 4 4 4 2 4 4 4 1 4 4 4 4 4 V10 V40 1 2 3 v4y 13 Jev Pojem jevu: Nechť {s1, sn} je výběrový soubor, X, Y, Z jsou znaky, B, Bb Bp jsou číselné množiny. Zápis {X g B} znamená jev „znak X nabyl hodnoty z množiny B" . Zápis {X g B1 a Y g B2 a ... a Z g Bp} znamená jev „znak X nabyl hodnoty z množiny B1 a současně znak Y nabyl hodnoty z množiny B2 atd. až znak Z nabyl hodnoty z množiny Bp". Symbol N(X g B) značí absolutní četnost jevu {X g B} ve výběrovém souboru, tj. počet těch objektů ve výběrovém souboru, pro něž xi g B. Symbol p(X g B) znamená relativní četnost jevu {X g B} ve výběrovém souboru, tj. p(X g B) = N(X g b) B1 n Y Analogicky N(X g p(X g B1 a Y g B2 a četnost jevu {X g B1 a Y g B2 a B2 Z 2 a ... a z g Bp) resp. a Z g Bp) znamená absolutní resp. relativní Bp} ve výběrovém soubo- a Z ru. 14 Příklad Příklad: Pro datový soubor s údaji o známkách najděte relativní četnost a) matematických jedničkářů b) úspěšných matematiků c) oboustranně neúspěšných studentů. Datový soubor má tvar: 2 0 3 1 3 3 1 3 1 1 4 4 2 4 2 4 1 4 4 U 40 10 Řešení: ad a) p(X = 1) ad b) p(X < 3) _7_ 20 12 20 0,35; 0,60; ad c) p(X = 4 a Y = 4) _4_ 20 0,20. Zjistili jsme, že jedničku z matematiky mělo 35% studentů, zkoušku z matematiky úspěšně složilo 60% studentů a oboustranně neúspěšnýchbylo20% studentů. 15 Jednorozměrné bodové rozložení četností Jestliže počet variant znaku X v jednorozměrném datovém souboru nenípříliš velký, pak přiřazujeme četnosti jednotlivým variantám a hovoříme o bodovém rozložení četností . Nechť je dán jednorozměrný datový soubor V* n 0 vněmž znak X nabývár variant. Pro j = 1, r definujeme: nj = N(X = x [j]) - absolutní četnost varianty x ^ ve výběrovém souboru pj = ^ - relativní četnost varianty x [j] ve výběrovém souboru Nj = N(X < x [j]) = ni + ... + nj - absolutní kumulativní četnost prvních j variant ve výběrovém souboru n p1 + ... + p j - relativní kumulativní četnost prvních j variant ve výb ěrovémsouboru Tabulka typu X[j] nj pj Nj X[1] ni pí Ni Fi x[r] nr Nr Fr se nazývá variační řada (nebo též tabulka rozložení četností). 16 x Príklad Příklad: Máme jednorozměrný datový soubor, který obsahuje údaje o známkách z matematiky (znak X) u 20 studentů. r2\ i 4 i i 4 3 3 i 1 4 4 2 4 2 4 i 4 4 Sestavte tabulku rozložení četností. Řešení: X[j] nj pj Nj LJ J i j 7 7/20=0,35 j 7 7/20=0,35 2 3 3/20=0,i5 i0 i0/20=0,50 3 2 2/20=0,i0 i2 i2/20=0,60 4 8 8/20=0,40 20 20/20=i,00 X 20 i,00 - - 17 Cetnostní funkce, empirická distribuční funkce Funkce p(x) se nazývá četnostní funkce. Pomocí relativních četností zavedeme četnostní funkci. fpjprox = xD],j = ^ . (0 jinak Četnostní funkceje nezáporná(" x e R: p(x) > 0) a normovaná( £p(x) = 1). x = - ¥ Pomocíkumulativních relativních četnostízavedeme empirickou distribučnífunkci. Funkce F(x) = distribučnífunkce. 0 pro x < xr1] Fjprox[j] £ x < x[j+= i,...,r -i se nazývá empirická 1pro x > x [r] Empirická distribuční funkce je neklesající(" x1, x2 e R, x1 < x2: F(x1) £ F(x2)), zprava spojitá("x0 e R libovolné, ale pevně dané: limx®xo+ F(x) = F(x0)) a normovaná(limx ®_¥ F(x) = 0, limx ®¥ F(x) = 1). Platí "xe R:F(x)=Jp((). t £ x 18 Příklad Příklad: Pro známky z matematiky nakreslete graf četnostní funkce a empirické distribuční funkce. Řešení: Variační řada Vzorce pi Nj 1 7 7/20=0,35 7 7/20=0,35 2 3 3/20=0,15 10 10/20=0,50 3 2 2/20=0,10 12 12/20=0,60 4 8 8/20=0,40 20 20/20=1,00 Z 20 1,00 - - p(x ) = F(x ) = [0 jinak 0 pro x < xm Fj pro xĽ] £ x < xU + l], j = 1 r - 1 1 pro x > x[r] Grafy vfté i ' 'L ^=4——% a i Í H y 19 Vztah mezi četnostní funkcí a empirickou distribuční funkcí 'xg R:F(x)=2>(t) t < x Pit) 0,4 0,2 0,0 1,0 0,8 0,6 0,4 0,2 0,0 1 L 2 H-1-*- .3 4 t —t-r~ 3 4 20 Grafické znázornění jednorozměrného bodového rozdělení četností Tečkový diagram: na číselné ose vyznačíme jednotlivé varianty znaku X a nad každou variantu nakreslíme tolik teček, jakáje její absolutní četnost. Polygon četnosti: je lomená čára spojující body, jejichž x-ová souřadnice je varianta znaku X a y-ová souřadnice je absolutní či relativní četnost této varianty. 9i- 8 7 ' 6 Polygon četností pro známky z matematiky 5 - 4 ~ 3 2 ~ 1 1- 12 3 4 21 Grafické znázornění jednorozměrného bodového rozdělení četností Sloupkový diagram: je soustava na sebe nenavazujících obdélníků, kde střed základny je varianta znaku X a výška je absolutní čirelativní četnost této varianty. ■ o - Sloupkový diagram známek z matematiky 12 3 4 Výsečový graf: je kruh rozdělený na výseče, jejichž vnější obvod odpovídáabsolutním četnostemvariant znaku X. 22 4 3 Dvourozměrné bodové rozložení četností Nechť je dán dvourozměrný datový soubor kde znak X már variant a znak Y má s variant. Pak definujeme: njk = N(X = x j a Y = y [k]) - simultánní absolutní četnost dvojice (x y[k]) ve výběrovém souboru n simultánní relativní četnost dvojice (x[j], y[k]) ve výběrovém souboru pjk = nj. = N(X = x[j]) = nji + ... + njs - marginální absolutní četnost varianty x[j] pj. = — = pj1 + ... + pjs- marginální relativní četnost varianty x[j] n.k = N(Y = y[k]) = nik + ... + nk - marginální absolutní četnost varianty y[k] p.k = — = pik + ... + prk - marginální relativní četnost varianty y[k] Absolutní kumulativní četnost dvojice (x [j], y[k]) = n^ = Nk = N (X jk u £ j v £ k Simultánní četností zapisujeme do kontinenční tabulky. Kontingenční tabulka simultánních absolutních četnostímátvar: y y[i] •• •y[s] nj. x njk x[i] nii .. .nis ni. x[r] nri .. .nrs nr. n.k n.i .. .n.s n 23 Příklad Příklad: Máme datový soubor, který obsahuje údaje o známkách z matematiky (znak X), z angličtiny (znak Y) a pohlaví studenta (znak Z, 0 - žena, 1 - muž) u 20 studentů: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 X 2 1 4 1 1 4 3 3 1 1 4 4 2 4 2 4 1 4 4 1 Y 2 3 3 1 2 4 3 4 1 1 2 4 2 3 3 4 1 3 4 3 Z 0 1 1 0 1 1 1 0 0 0 1 0 0 1 1 0 0 1 1 0 Vytvořte kontingenční tabulku simultánních absolutních a relativních četností pro známky z matematiky a angličtiny. Řešení: Kontingenční tabulka simultánních absolutních četností Kontingenční tabulka simultánních relativních četností 1 2 3 4 n.ik ! L 4 1 2 0 7 2 • 0 :■: 1 i:- i 3 0 0 L 1 4 0 1 ■i ■ i 1 ■l 25 Příklad Příklad: Sestrojte graf simultánní četnostní funkce pro známky z matematiky a angličtiny. Řešení: Vyjdeme z kontingenční tabulky simultánních relativních četností. 1 v i 2 3 4 ř*j 1 0,20 0,05 0,10 0,00 0,35 2 0,00 run 0*05 0,00 0,10 3 0,00 0,0« 0.05 0,0o 0,10 i 0,00 0,05 ÍJ.1Ô 0,20 J'-r: 0,20 0,20 0;íí 0,2* L,{)[) 26 Četností nezávislost znaku v daném výběrovém souboru Řekneme, že znaky X, Y jsou v daném výběrovém souboru četnostně nezávislé, právě když pro všechna j = 1, r a všechna k = 1, s platí multiplikativní vztah: Pjk = pj. p.k neboli pro " (x, y) e R2: p(x, y) = pi(x) p2(y). Příklad: Ověřte, zda v našem datovém souboru jsou známky z matematiky a angličtiny četnostně nezávislé. Řešení: Vyjdeme z kontingenční tabulky relativních četností. 1 2 3 4 PJ X 1 ty* I 0,20 0,05 0,10 0;00 0,35 2 0,00 ÍU0 0,05 0,00 0,15 3 0,00 o,oo 0.05 0,05 0,10 4 0,00 0,05 0.1 íj 0,20 0,«l0 0,20 0,20 0,35 0,25 !,{)[) Známky z matematiky a angličtiny nejsou četnostně nezávislé, protože užpro j = 1, k = 1 je multiplikativnívztah porušen: pii = 0,20, pi. = 0,35, p.i = 0,20, tudíž 0,20 * 0,35.0,20 27 Řádkově a sloupcově podmíněné relativní četnosti Sloupcově podmíněná relativní četnost varianty x[j] za předpokladu y[k] _ j Řádkově podmíněná relativní četnost varianty y[k] za předpokladu x[j] _ j n j ■ 28 Příklad Příklad: Pro datový soubor známek z matematiky a angličtiny sestavte kontingenční tabulku sloupcově a poté řádkově podmíněných relativních četností. Řešení: Nejprve se budeme zabývat sloupcově podmíněnými relativními četnostmi. Použijeme vzorec pj(k} = n, Vyjdeme z kontingenční tabulky simultánních absolutních četností. _ T 2 3 4 __ n.ik V 4 [ 2 0 r Cl :■! 1 c- 0 0 1 1 4 0 1 9 ■1 \ 1 ■1 ? JL y i 2 3 4 1 1,00 D.25 0t29 0,00 2 0.00 0,50 o,u 0.00 o,oo 0,00 0,14 0,20 4 0,00 0,25 0,-13 0fS0 1,00 1,00 1,00 1,00 Interpretujeme např. třetí sloupec: z těch studentů, kteří měli trojku z angličtiny, mělo 2/7 = 29% jedničku z matematiky, 1/7 = 14% dvojku z matematiky, 1/7 = 14% trojku z matematiky a 3/7 = 43% čtyřku z matematiky. 29 Příklad Dále se budeme zabývat řádkově podmíněnými relativními četnostmi. Použijeme vzorec p (j )k = —. Opět nám poslouží kontingenční tabulka absolutních četností. f..... y 12 3 4 ... ^ T i = 4 12 0 0 1 L 0 : 0 0 J 1 71= 2(} \ i vi.r i ,u\, (up u2), (ur, ur (ur+1, co) tak, aby okrajové intervaly neobsahovaly žádnou pozorovanou hodnotu znaku X. Užíváme označení: (uj9 uj+^ - j-tý třídicí interval znaku X, j = 1, r. dj = uj+1 - uj - délka j-tého třídicího intervalu znaku X x[j] = uj - střed j-tého třídicího intervalu znaku X _4_ —r-1---—r—- 32 Intervalové rozložení četností-stanovení počtu tříd Třídicí intervaly volíme nejčastěji stejně dlouhé. Jejich počet určíme např. pomocí Sturgersova pravidla: r = 1 + 3,3 log n, kde n je rozsah souboru. □ počet tříd (r): ■ do 100 prvků...............6 až 9 tříd ■ do 500 prvků...............10 až 15 tříd ■ nad 500 prvků..............Sturgesovo pravidlo r » 1 + 33 log n log...dekadický logaritmus!!! 33 Sestavení tabulky rozložení četností Hodnoty znaku X roztřídíme do r třídicích intervalů. Pro j = 1, r definujeme: nj = N(uj < X < uj+1) - absolutní četnost j-tého třídicího intervalu ve výběrovém souboru pj = ^ - relativní četnost j-tého třídicího intervalu ve výběrovém souboru četnostní hustota j-tého třídicího intervalu ve výběrovém souboru absolutní kumulativní četnost prvních j třídicích n fj = pi j dj Nj = N(X < uj+i) = ni + ... + nj intervalů ve výběrovém souboru F; = N = pi + ... + p; - relativní kumulativní četnost prvních j třídicích intervalů ve výběrovém souboru. Tabulka typu dj n j pj j ý ATj Fj (wiŤ«a) di Tli Pi h Ar] Fi dr ľlr pr !r Fi Součet n 1 se nazývá tabulka rozložení četností. 34 Příklad Příklad: Do laboratoře bylo dodáno 60 vzorků a byly zjištěny a hodnoty znaku X mez plasticity (v kp/cm2) a Y - mez pevnosti (v kp/cm2). Datový soubor má tvar: " 1&4 17S " S3 73 7'.. 133 164 196 111 77 35 £8 7:, 72 lU-j 47 31 145 131 B5 103 68 es S4 107 112 l lij 137 142 : L3 141 3* LQ2 44 tfS 97 1 0) a normovaná ( jf(x)dx = i). Intervalová -o empirická distribuční funkce je neklesající, spojitá a normovaná (limx®-¥F(x) = 0, limx ®o F(x) = i). 37 Příklad Příklad: Pro mez plasticity oceli nakreslete histogram a pod histogram graf intervalovéempirickédistribučnífunkce. dj xM nj pj Nj Fj fj (30,50) 20 40 8 8/60 = 0,i3 8 8/60 = 0,i3 8/(60 • 20) = 0,006 (50,70) 20 60 4 4/60 = 0,06 i2 i2/60 = 0,2 4/(60 • 20) = 0,003 (70,90) 20 80 i3 i3/60 = 0,2i6 25 25/60 = 0,4i6 i3/(60 • 20) = 0,0i83 (>0,ii0) 20 i00 i5 i5/60 = 0,25 40 40/60 = 0,6 i5/(60 • 20) = 0,0i25 (li0,i30) 20 i20 9 9/60 = 0,i5 49 49/60 = 0,8i6 9/(60 • 20) = 0,0075 (30,i50) 20 i40 7 7/60 = 0,ii6 56 56/60 = 0,93 7/(60 • 20) = 0,00583 Í50,i70) 20 i60 4 4/60 = 0,06 60 60/60 = i 4/(60 • 20) = 0,003 Součty 60 i 38 Příklad (lj,Uj+i) dj x[j] nj Nj Fj fj (50,50> 20 40 8 8/60 = 0,13 8 8/60 = 0,13 8/(60 • 20) = 0,006 (50,70> 20 60 4 4/60 = 0,06 12 12/60 = 0,2 4/(60-20) = 0,003 (70,90> 20 80 13 13/60 = 0,216 25 25/60 = 0,416 13/(60 • 20) = 0,0183 (»0,11(0 20 100 15 15/60 = 0,25 40 40/60 = 0,6 15/(60 • 20) = 0,0125 (110,130) 20 120 9 9/60 = 0,15 49 49/60 = 0,816 9/(60 • 20) = 0,0075 (l30,15(0 20 140 7 7/60 = 0,116 56 56/60 = 0,93 7/(60 • 20) = 0,00583 (150,170 20 160 4 4/60 = 0,06 60 60/60 = 1 4/(60-20) = 0,003 Součty 60 1 39 Dvourozměrné intervalové rozložení četností Dále se budeme věnovat dvourozměrnému intervalovému rozložení četností, tj. budeme pracovat s dvourozměrným datovým souborem. Zavedeme podobné pojmy jako u dvourozměrnéhobodového rozložení četností í. Nechť je dán dvourozměrný datový soubor znaku X ro ztřídíme do r třídicích intervalů (u j,uj+1 kde hodnoty s délkami d1 , dr a hodnoty znaku Y roztřídíme do střídicích intervalů (v vk, v, k+1 Obdélník (uj,uj+^ x( interval. ), k = 1, s s délkami hi, hs. \+1) se nazývá (j,k) -tý dvourozměrný třídicí Vk 40 Simultánnía marginální četnosti njk = N(uj < X < uj+i a vk < Y < vk+i) - simultánní absolutní četnost (j, k)-téhotřídicího intervalu. pJk n. n simultánní relativní četnost (j, k)-téhotřídicího intervalu. nj. = nj1 + ... + njs - marginální absolutní četnost J-téhotřídicího intervalu pro znak X. n marginální relativní četnost J-téhotřídicího intervalu pro znak X. n.k = nik + ... + nrk - marginální absolutní četnost k-téhotřídicího intervalu pro znak Y. — - marginální relativní četnost k-téhotřídicího intervalu pro znak Y. n p.k fjk = f.k = djhk hk - simultánní četnostní hustota v (j, k)-témtřídicím intervalu. marginální četnostní hustota vj-témtřídicím intervalu pro znak X. - marginální četnostní hustota v k-témtřídicím intervalu pro znak Y. Kteroukoliv ze simultánních četností zapisujeme do kontingenční tabulky. Kontingenčnítabulka simultánních absolutních četností: JÍJ- nu 1*1, (wríur-|_i) 7lT. 41 Příklad Příklad: Pro datový soubor obsahující údaje o mezi plasticity (znak X) a mezi pevnosti (znak Y) oceli a) stanovte dle Sturgersova pravidla optimální počet třídicích intervalů pro znak Y b) sestavte kontingenční tabulku simultánních absolutních četností. Řešení: ad a) Rozsah datového souboru je 60. Podle Sturgersova pravidla je tedy optimální počet třídicích intervalů 7. Nejmenší hodnota je 52 a největší 189. Volíme vi = 50, v2 = 70, v8 = 190. ad b) fatal tto+ií fa), 70) (70, £0) (íkí, im; {110, 130) (130,150) i l SO, l 70) [170, 190) nt. ! IHj.«j+l) (30, 50) 5 3 0 0 0 0 Q B (50,70) 0 3 L n u íl í) i (70,130) íl 4 7 1 1 íl U 13 (yu,iiuj (1 U '"i 1 íl 0 15 (110,13í)} 0 n n 4 5 íl 0 9 (130,150} 0 n 0 0 2 ■ 0 7 (150,170} 0 U [) d 0 1 3 4 1 n* 5 10 14 13 y 3 n = 60 42 Stereogram Dvourozměrné intervalové rozložení četností graficky znázorňujeme pomocí stereogramu. Je to graf skládající se z r *s kvádrů, sestrojených nad dvourozměrnými třídicími intervaly, přičemž objem (j, k)-tého kvádru je roven relativní četnosti pjk (j, k) -téhotřídicího intervalu, j = 1, r, k = 1, s. Výška kvádru tedy vyjadřuje simultánní četnostní hustotu. V našem příkladě s mezí plasticity a mezí pevnosti oceli bude mít stereogram tvar: 43 Simultánní a marginální hustota četnosti Pomocí simultánních četnostních hustot zavedeme simultánní hustotu četnosti: T-i i x ffjk Pro u. < x £ uJ+1, vk < y £ vk+1, j = 1, •••, r, k = 1, •••, s , , Funkce f (x, y ) = í jk J J+1 k k+1 se nazývá [0 Jinak simultánní hustota četnosti. Jejím grafem je schodovitá plocha shora omezující stereogram. Hustoty četnosti pro znaky X a Y odlišíme indexem takto: f (x ) = ffj. pro uj < x £ u j = 1, L, r [O jinak ' f (y) = Vk < y £ Vk+1' k = 1j ^' S 2 [O jinak Mezi simultánní hustotou četnosti a marginálními hustotami četnosti platí vztahy: fi(x)= jf(x, y)dy, f2(y)= jf(x, y)dx. — ¥ —¥ 44 Cetnostní nezávislost znaků v daném výběrovém souboru při intervalovém rozložení četností Pomocí simultánních a marginálních cetnostní zavedeme pojem č etnostní nezávislosti znaků v daném výběrovém souboru při intervalovém rozložení četností: Řekneme, že znaky X, Y jsou v daném výběrovém souboru četnostně nezávislé při intervalovém rozložení četností, jestliže pro všechna j = 1, r a všechna k = 1, ...,s platí multiplikativní vztah: fjk = fj_ fk neboli pro v (x, y) e r2 : f(x, y) = f1(x) f2(y). V našem příkladě nejsou mez pevnosti a mez plasticity četnostně nezávislé, protože už pro j = 1, k = 1 je multiplikativní vztah porušen: í.Ml 711; [70,ao) [90. im) (110, 130) (130,150) (150,170) [170,190) ! lHj.«j+l) (30,50) p, 0 0 0 0 0 R 1-iíLľíJ) C L n u íl n i (70,130) c 7 1 1 íl Q 13 (130,110) ■: 0 ■i 1 íl D L5 (110,13ti) 0 II ľ 4 5 íl D 9 (130,150) G II [) 0 2 ■ D 7 (150,170 c u 0 d ■:: 1 J 4 1 n.k 14 13 y 3 íl = m f11 =-5-= 0,000208, f = —— = 0,006667, f1 = —— = 0,004167, tudíž 11 60 • 20 • 20 60 • 20 60 • 20 0,000208 + 0,006667.0,004167 = 0,000028 45 2. Číselné charakteristiky Doposud jsme se zabývali funkcionálními charakteristikami znaků, jako jsou: - empirická distribuční funkce F(x), - simultánní četnostní funkce p(x,y), - marginální četnostní funkce pi(x), p2(y), - simultánní hustots četnosti f(x,y), - marginální hustoty četnosti fi(x), f2(y), které nesou úplnou informaci o rozložení četností. Nyní zavedeme číselné charakteristiky, které nás informují o některých rysech tohoto rozložení četností: - o poloze (úrovni) hodnot znaku, - o jejich variabilitě (rozptýlení), - o těsnosti závislosti dvou znaků - a pod. Pro různé typy znaků se používají různé číselné charakteristiky, proto se nejdřív seznámíme s jednotlivými typy znaků. 46 Typy znaků Nominální znak: připouští obsahovou interpretaci pouze u relace rovnosti =. O dvou variantách nominálního znaku lze pouze konstatovat, že jsou buď stejné nebo různé. Čísla, která přiřadíme jednotlivým variantám znaku, nereprezentují skutečnou hodnotu použitých čísel, ale jsou pouhým označením variant znaku. Příklady nominálních znaků: lékařská diagnóza, typ profese, barva očí, rodinný stav, národnost, ... Ordinální znak: připouští obsahovou interpretaci nejen u relace rovnosti =, ale též u relace uspořádání <. Můžeme tedy konstatovat, že varianta je větší (dokonalejší, silnější, vhodnější) než varianta x[k]. Příklad ordinálního znaku: školní klasifikace vyjadřuje menší nebo větší znalosti zkoušených žáků - jedničkář je lepší než dvojkař, ale intervaly mezi známkami nemají obsahovou interpretaci. Nelze tvrdit, že rozdíl ve znalostech mezi jedničkářem a dvojkařem je stejný jako mezi trojkařem a čtyřkařem. Další příklady: Různá bodování ve sportovních a uměleckých soutěžích, posuzování různých rysů sociálního chování, posuzování stavu pacientů, hodnocení postojů respondentů k různým otázkám, . 47 Typy znaků Intervalový znak: kromě relací rovnosti = a uspořádání < umožňuje obsahovou interpretaci také u operace rozdílu tj. stejný interval mezi jednou dvojicí hodnot a jinou dvojicí hodnot vyjadřuje i stejný rozdíl v extenzitě zkoumané vlastnosti. Příklad intervalového znaku: teplota měřená ve stupních Celsia. Např. naměříme-li ve čtyřech po sobě jdoucích dnech polední teploty 0, 2, 4, 6 °C, znamená to, že každým dnem stouply teploty o 2 °C. Nelze však říci, že z druhého na třetí den vzrostla teplota dvojnásobně, kdežto ze třetího na čtvrtý den pouze jeden a půl krát. Další příklady: kalendářní systémy, směr větru, inteligenční kvocient, ... Společný znak intervalových znaků: nula byla stanovena uměle, pouhou konvencí. Poměrový znak: kromě relací rovnosti = a uspořádání < umožňuje obsahovou interpretaci také u operací rozdílu - a podílu /, tj. stejný poměr mezi jednou dvojicí hodnot a jinou dvojicí hodnot vyjadřuje i stejný podíl v extenzitě zkoumané vlastnosti. Příklad poměrového znaku: délka předmětu měřená v cm. Má-li jeden předmět délku 8 cm a druhý 16 cm, má smysl prohlásit, že druhý předmět je dvakrát delší než první předmět. Další příklady: počet dětí v rodině, výška kapesného v Kč, hmotnost osoby, ... Společný znak poměrových znaků: Poměrový znak má přirozený počátek, ke kterému jsou vztahovány všechny další hodnoty znaku. Mimo uvedenou klasifikaci stojí alternativní znaky, které nabývají jen dvou hodnot, např. 0,1, což znamená absenci a prezenci nějakého jevu. Například 0 bude znamenat neúspěch, l úspěch při řešení určité úlohy. Alternativní znaky mohou být ztotožněny s 48 kterýmkoliv z předcházejících typů. Typy znaků II > Demografické znaky: > Klienta (věk, pohlaví, rodinný stav, počet dětí, druh bydlení, kraj/okres trvalého bydliště...) > Prodejního místa (kraj/okres, typ, prodejní plocha,...) > Prodejce (věk, pohlaví, kraj/okres trvalého bydliště...) > Klienta („stáří" klienta, doposud splacená jistina, dlužná jistina, počet dnípo splatnosti,.) > Prodejního místa („stáří" prodejny, počet uzavřených smluv, objem uzavřených smluv, podíl nesplácených úvěrů,...) > Prodejce (počet uzavřených smluv, objem uzavřených smluv, podíl nesplácených úvěrů .) Behaviorální znaky: Produktové znaky: > Výše úvěru, délka smlouvy, akontace, RPSN,... 49 Číselné charakteristiky nominálních znaků Charakteristika polohy: modus - nejčetnější varianta resp. střed nej četnějšího třídicího intervalu. Příklad na stanovení modu 20 náhodně vybraných osob mělo odpovědět na otázku, který z pěti výrobků (označíme je A, B, C, D, E) preferují. Výsledky máme v tabulce: Výrobek A B C D E Četnost odpovědí 3 5 3 6 3 Stanovte modus. v Rešení: Modus = D Označení: x 50 Cramérův koeficient Charakteristika těsnosti závislosti dvou nominálních znaků: Cramérův koeficient kontingence. Carl Harald Cramér (1893 - 1985): Švédský matematik 51 Cramérův koeficient Nechť znak X nabývá variant x[1], x[r] a znak Y nabývá variant y[i], y[s]. Máme dvourozměrný datový soubor .......Zjistíme absolutní četnosti njk dvojice variant (x[j],y[k]), j = 1, r, k = 1, s a uspořádáme je do kontingenční tabulky: y y[1 ...y[s] ] nj. x njk x[1] x[r] n11 ...n1s •••nrs nr. Ľ J n.k n.i ...ns n Vypočteme tzv. teoretické četnosti a sjejich pomocí pak statistiku n r s n jk nj.n.k n \2 j=1 k=1 nj.n.k n Cramérův koeficient: v K n(m -1) kde m = min{r,s}. Tento koeficient nabývá hodnot mezi 0 a 1. Cím blíže je 1, tím je těsnější závislost mezi X a Y, čím blíže je 0, tím je tato závislost volnější. 52 Cramérův koeficient Význam hodnot Cramérova koeficientu: mezi 0 až0,1 ... zanedbatelná závislost, mezi 0,1 až0,3 ... slabá závislost, mezi 0,3 až 0,7 ... střední závislost, mezi 0,7 ažl ... silná závislost. 53 Příklad Příklad na výpočet Cramérova koeficientu: 686 náhodně vybraných osob bylo dotázáno, zda vlastní auto (znak X, varianty 1 -ano, 2 - ne) a zda jsou ochotny používat MHD (znak Y, varianty 1 - ano, 2 - ne). Výsledky průzkumu jsou uvedeny v kontingenční tabulce Vypočtěte a interpretujte Cramérův koeficient. X Y nj. ano ne ano 56 312 368 ne 283 35 318 n.k 339 347 686 = 186,1458, = 160,8542 Řešení: Nejprve vypočteme teoretické četnosti: nLn.1 = 368 • 339 = 1818542 = 368 • 347 n 686 , , n 686 = SIS^ = 157458, = 318V347 : n 686 n 686 Nyní dosadíme do vzorce pro výpočet statistiky K: ^ (56-181,8542, (312-186,1458)" , (283-157,1458)" , (35-160,8542)" „. Acr K =--1---1---1--= 371,456 181,8542 186,1485 157,1458 160,8542 Nakonec vypočteme Cramérůvkoeficient: V = /IŽM56 = o,7358 V 686 • 1 Hodnota Cramérova koeficientu svědčí o tom, že mezi znaky X a Y existuje silná závislost. 54 Číselné charakteristiky ordinálních znaků Charakteristika polohy: a-kvantil. Je-li a e (0; 1), pak a-kvantil xa je číslo, které rozděluje uspořádaný datový soubor na dolní úsek, obsahující aspoň podíl a všech dat a na horní úsek obsahující aspoň podíl 1 - a všech dat. Pro výpočet a-kvantilu slouží algoritmus: celé číslo c == xa = ——--—- na= / a 2 ynecelé číslo => zaokrouhlíme nahoru na nejbližší celé číslo c => x a = x(c) Pro speciálně zvolená a užíváme názvů: x050 - medián, x025 - dolní kvartil, x075 horní kvartil, x01, x09 - decily, x001, x099 - percentily. Charakteristika variability: kvartilová odchylka: q = x0 75 - x025. 55 Příklad Příklad na výpočet kvantilů: U 50 žáků 7. ročníku jedné základní školy byly na pololetním vysvědčení zjištěny známky z matematiky: známka 1 2 3 4 5 četnost známky 9 15 20 4 2 Určete medián, 1. a 9. decil a kvartilovou odchylku. Řešení: Pro snadnějšívýpočet tabulku doplníme ještě o absolutní kumulativní četnosti: Rozsah souboru n = 50 známka 1 2 3 4 5 nj 9 15 20 4 2 Nj 9 24 44 48 50 a na c Xa 0,50 50.0,5=25 25 X (25) + X (26)= 3 + 3 _ 3 2 2 0,10 50.0,1 = 5 5 X (5) + X (6) _ 1 + 1 _ 1 2 2 0,90 50.0,9 = 45 45 X(45) + X(46) _ 4 + 4 _ 4 2 2 0,25 50.0,25 = 12,5 13 X(13) = 2 0,75 50.0,75 = 37,5 38 X(38) = 3 Kvartilová odchylka: q = 3 - 2 = 1. Interpretace např. dolního kvartilu: V souboru žáků je aspoňčtvrtina takových, kteří mají z matematiky jedničku nebo dvojk u (neboli v souboru 50 žáků jsou aspoň tři čtvrtiny takových, kteřímajízmatematiky dvojku či horšíznámku). 56 Příklad 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 4 4 5 6 8 8 12 12 13 14 14 14 18 19 x 0,25 L x 0,5 x 0,75 _LÍiUNi I Pp |Fi J__1__1 0,07 0,07 4__2 3 0,13^0,201^ 5 1 4 0,07 0,27 12__2__9 0,13 0,60 13__1 10 0,07 0,67 14 3Íi3J 0 2010 87 6__1__5 0,07 0,33 /> 8__2__7 0,13 0,47L^ 18__1 1410,0710,93 19 1 15 0,07 1,00 Součet | 15 | x 11,00 |x X0,25 = X0,5 = x 0,75 X = 14 5 ~ = 12 = 14 q = x 0,75 X0,25 = 14 5 = 9 X025 je tedy hodnota, u které Fj poprvépřekročí 0,25. !!! Pokud ale Fj=a pro nějaké XM» Xa =(X[J]+ X[j+1])/2_ ť> Xo,2=(4+5)/2=4,5 57 Modus a kvantily pro intervalově tříděná data x — dm +-Um nm~x--h 2 nm — nm—1 — nm+1 dm je dolní mez modálnítřídy, nm,nm—19nm+1 je četnost modální, předcházející a následujícítřídy, h je šířka třídy Xp — dp + * h Pp dp je dolní mez třídy obsahujícípříslušný P-kvantil, pp je relativní četnost této třídy, FP—1 je kumulativní relativní četnost předcházejícítřídy, h je šířka třídy 58 Příklad Určete modus a medián. Xi mcnč než 15> 22 (15;20> 34 (20;25> 72 (25;30> 102 (30;35> 127 více než 35 135 59 Příklad •Ví méně než I5> 22 (I5;20> 34 (2(k25> 72 (25I0> 102 (3l):|> 127 více nc^5 135 x = 20 + Xi Pi Nj 12.5 22 0,16 22 0,16 17.5 I12 0,09 34 0,25' 22.5 38 0,2fr V 72 0,53 27.5 7 30 0,22 \l02 0,76 0,19 \ 0,94 0,06 135 \ too ^Součet f 135 1,00 X \ • 5 x = 20 0,5 - 0,25 2 • 38 -12 - 30 0,28 • 5 23,82 24,46 60 Charakteristika těsnosti závislosti dvou ordinálních znaků: Spearmanův koeficient pořadové korelace Charles Edward Spearman (1863 - 1945): Britský psycholog a statistik Nejprve je nutné vysvětlit pojem pořadí čísla v posloupnosti čísel. Nechť x1? ..., xn je posloupnost reálných čísel. a) Jsou-li čísla navzájem různá, pak pořadím Ri čísla xi rozumíme počet těch čísel x1, ..., xn, která jsou menší nebo rovna číslu xi. b) Vyskytují-li se mezi danými čísly skupinky stejných čísel, pak každé takové skupince přiřadíme průměrné pořadí. 61 Příklad Příklad na stanovení pořadí a) Jsou dána čísla 9, 4, 5, 7, 3, 1. b) Jsou dána čísla 6, 7, 7, 9, 6, 10, 8, 6, 6, 9. Stanovte pořadí těchto čísel. Řešení ad a) usp. čísla 1 3 4 5 7 9 pořadí 1 2 3 4 5 6 ad b) usp. čísla 6 6 6 6 7 7 8 9 9 10 pořadí 1 2 3 4 5 6 7 8 9 10 prům. pořadí 2,5 2,5 2,5 2,5 5,5 5,5 7 8,5 8,5 10 62 Spearmanův koeficient Vzorec pro výpočet Spearmanova koeficientu: r xi yi Předpokládejme, že máme dvourozměrný datový soubor ...... hodnoty xi a Qi pořadí hodnoty yj, i = i, n. ^__ Spearmanův koeficient pořadové korelace: rS = i —t-|— Označíme Ri pořadí Vlastnosti Spearmanova koeficientu pořadové korelace: Koeficient nabývá hodnot mezi -i a i. Čím je bližší i, tím je silnějšípřímá pořadová závislost mezi znaky X a Y, čím je bližší -i, tím je silnější nepřímá po řadová závislost mezi znaky X a Y. Je-li rS = i resp. rS = -i, pak dvojice (xi, yi) leží na nějaké vzestupné resp. klesající funkci. Hodnoty rS se nezmění, když provedeme vzestupnou transformaci původních dat. Hodnoty rS se vynásobí -i, když provedeme sestupnou transformaci původních dat. Koeficient je symetrický. Koeficient je rezistentnívůči odlehlým hodnotám. 63 Spearmanův koeficient Význam absolutní hodnoty Spearmanova koeficientu: mezi 0 až0,1 ... zanedbatelná pořadová závislost, mezi 0,1 až 0,3 ... slabápořadovázávislost, mezi 0,3 až0,7 .střednípořadovázávislost, mezi 0,7 až1 .silnápořadovázávislost. 64 Ilustrace významu Spearmanova koeficientu pořadové korelace rs = 0,82 rs = 0,69 rs rs = 0 rs rs = -1 O OQ OO 0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16 65 12 10 10 1,5 1,2 Příklad Příklad na výpočet Spearmanova koeficientu pořadové korelace: Je dán dvourozměrný datový soubor 2,5 13,4N 3,4 15,2 1,3 11,8 5,8 13,1 v3,6 14,5 ^ Vypočtěte Spearmanův koeficient pořadové korelace. Řešení: Xi 2,5 3,4 1,3 5,8 3,6 yi 13,4 15,2 11,8 13,1 14,5 Ri 2 3 1 5 4 Qi 3 5 1 2 4 (Ri-Qi)2 1 4 0 9 0 rs =1 —r nn 6 6 Qi )2 = 1 -^r(1 + 4 + 0 + 9 + 0 ) = 1- 6 • 14 = 0,3 5 • 24 v 5 • 24 Znamená to, že mezi znaky X a Y existuje slabá přímá pořadová závislost. 66 Číselné charakteristiky intervalových znaků Charakteristika polohy: aritmetický průměr je součet hodnot dělený jejich počtem^n = — Pomocí průměru zavedeme i-tou centrovanou hodnotu xi - m (podle znaménka poznáme, zda i-tá hodnota je podprůměrná či nadprůměrná). Znázornění rozložení četností dvou datových souborů, které se liší aritmetickým průměrem Rozdělení s různými polohami o >o 500 400 300 200 100 0 Často se aritmetický průměr označuje x: x = '7 xi n 05101520 hodnota znaku i=1 67 Příklad Příklad: Pro datový soubor obsahující údaje o mezi plasticity (znak X) a mezi pevnosti oceli (znak Y) vypočtěte aritmetické průměry znaků X, Y. 178 " S3 ľ"" 76 L 33 104 106 111 ?: es S3 7:, 32 li. 41 61 145 im ES 103 5& B5 94 1D7 112 llří 13ř 142 i L3 141 !is L 02 44 ti) '..'7 !03 LOS S3 US 121 127 99 119 141 157 119 .04 128 !-■ 1L3 ías .07 |]« 155 B5 97 PS Ji;: 81 41 72 97 115 íeä 106 101 72 7:J 89 ■■: ■m «1 SI uu -ľ.í 01 51 147 m 123 101 33 52 16D - Sil" 76 117 lie L47 87 i::: ■1-1 137 15a 179 nn 135 1 Ur 51 Řešení: 154 +133 + ... + 85 m1 = 60 95,9, m2 = 178 +164 +... + 91 60 = 114,4 68 Aritmetický průměr Vlastnosti aritmetického průměru - Aritmetický průměr si lze představit jako těžiště dat - součet podprůměrných hodnot je stejný jako součet nadprůměrných hodnot - oba součty jsou v rovnováze. - Průměr centrovaných hodnot je nulový, protože — V (xi - m) = — V xi —V m =m---n • m = 0 = 0. n tí ntť nt! n n - Výraz V(xi - a)2 (tzv. kvadratická odchylka) nabývá svého minima pro a = m. Uvedený výraz charakterizuje i=1 celkovou chybu, které se dopustíme, když datový soubor nahradíme jedinou hodnotou a. Tato chyba je tedy nejmenší, když datový soubor nahradíme aritmetickým průměrem, přičemž za míru chyby považujeme kvadratickou odchylku. - Aritmetický průměr je silně ovlivněn extrémními hodnotami. - Aritmetický průměr je vhodné použít, pokud je rozložení dat přibližně symetrické. 69 Rozptyl, směrodatná odchylka Charakteristika variability: rozptyl je průměrná kvadratická odchylka hodnot od jejich aritmetického průměru 1 n /- s2 = — ^(xi - m)2. Kladná odmocnina z rozptylu se nazývá směrodatná odchylka s = v s2. Pomocí směrodatné odchylky i=1 zavedeme i-tou standardizovanou hodnotu —- od průměru). ( 1 n Výpočetní tvar vzorce pro rozptyl: s2 = — ^ (vyjadřuje, o kolik směrodatných odchylek se i-tá hodnota odchýlila vn i=i 0 - m Znázornění rozložení četností dvou datových souborů, které se liší rozptylem: 70 s 2 Příklad Příklad: Pro datový soubor obsahující údaje o mezi plasticity (znak X) a mezi pevnosti oceli (znak Y) vypočtěte rozptyly a směrodatné odchylky znaků X, Y. Přitom již víme, že mi = 95,5 a m2 = 114,4. " 1W 17* " 83 &S ""ä 7C = :II 111 77 35 58 ?:■ "2 10-1 ■17 «1 145 151 fis lflS -65 94 107 I1S 137 142 113 141 MS L 02 44 «3 97 103 ins 92 116 121 l:r. 99 119 141 157 .J:J 104 126 Lift 1&9 112 125 107 US 136 1Ô5 97 93 J -1-51 81 41 VJ 37 lis iae 163 96 113 105 101 72 79 45 71 93 00 SI aa 109 :íu 69 42 SI Si Í)S 152 147 113 123 101 114 33 52 42 s5 ISO I šili 7S 1 17 m 1 17 87 H>: 114 137 153 179 sa 133 125 l-U: &5 » Řešení: 2 1 V"1 2 2 1 - ^ i 1 60 n i=1 2 = i n i=1 s2 = I y 1 (1542 +1332 + ... + 852)-95,52 = 1052,40, s1 = V1052,40 = 32,4 i ííí2 - —(1782 +1642 + ... + 912)-114,42 = 1057,21, s1 = V1057,21 = 32,5 60 2 2 1 m2 = 71 Rozptyl, směrodatná odchylka - vlastnosti Vlastnosti rozptylu a směrodatné odchylky: - Směrodatná odchylka je nulová pouze tehdy, když jsou všechny hodnoty stejné, jinak je kladná. - Rozptyl centrovaných hodnot je roven původnímu rozptylu, neboť — - m)- 0]2 = — V (xi - m)2 =; n 7=1 nf=ť 1 ^ Rozptyl standardizovaných hodnot je 1, protože — V n xi - m - 0 i=1 v =-r • - V(xi- m)2 = ^=1 s2 n 7=1 s2 Rozptyl či směrodatná odchylka jsou stejně jako průměr silně ovlivněny extrémními hodnotami. Rozptyl či směrodatná odchylka se nehodí jako charakteristiky variability, je-li rozložení dat nesymetrické. 72 Sikmost 1 £&,- m)' i =1 Charakteristika nesymetrie dat: šikmost a 3 Je-li rozložení dat symetrické kolem aritmetického průměru, pak a3 0. Má-li rozložení dat prodloužený pravý konec, jde o kladně zešikmené rozložení a3 >0. Má-li rozložení dar prodloužený levý konec, jde o záporně zešikmené rozložení a3 <0. Znázornění rozložení četností dvou datových souborů, které se liší aritmetickým průměrem a šikmostí o Rozdělení s různými polohami a šikmostmi 500 400 300 200 100 0 0510152025 hodnota znaku a3 < 0: Pravostranná asymetrie a3 0: Symetrie J n _ - ti-1 ::: : M - — - - — - m J 0-ľnT-- --ÍTíT a3 > 0: Levostranná asymetrie 73 Spičatost Charakteristika koncentrace dat kolem průměru: špičatost a 4 = —u-- 3 Je-li rozložení dat normální (Gaussovo), pak a4 Je-li rozložení dat strmé, pak a4 > 0. Je-li rozložení dat ploché, pak a4 < 0. 0. Znázornění rozložení četností dvou datových souborů, které se liší špičatostí Rozdělení s různými špičatostmi a4 < 0: Podnormální špičatost o 250 -200 150 100 - 50 0 ^ a4 4 0: Normální špičatost a4 > 0: Nadnormální špičatost 2 7 12 17 22 hodnota znaku 74 Kovariance Charakteristika společné variability dvou intervalových znaků: kovariance . Označme nm m2 průměry znaků X, Y a Si, s2 Předpokládejme, že máme dvourozměrný datový soubor ...... směrodatné odchylky znaků X, Y. Zavedeme kovarianci jako charakteristiku společné variability znaků X, Y kolem jejich průměrů ^s12 =1Z (xi - m1 )(yi - m2 )^ Kovariance je průměrem součinů centrovaných hodnot. Pokud se nadprůměrné (podprůměrné) hodnoty znaku X sdružují s nadprůměrnými (podprůměrnými) hodnotami znaku Y, budou součiny centrovaných hodnot xi - mi a yi - m2 vesměs kladné a jejich průměr (tj. kovariance) rovněž. Znamená to, že mezi znaky X, Y existuje určitý stupeň přímé lineární závislosti. Říkáme, že znaky X, Y jsou kladně korelované. Pokud se nadprůměrné (podprůměrné) hodnoty znaku X sdružují s podprůměrnými (nadprůměrnými) hodnotami znaku Y, budou součiny centrovaných hodnot vesměs záporné a jejich průměr rovněž. Znamená to, že mezi znaky X a Y existuje určitý stupeň nepřímé lineární závislosti. Říkáme, že znaky X, Y jsou záporně korelované. Je-li kovariance nulová, pak řekneme, že znaky X, Y jsou nekorelované a znamená to, že mezi nimi neexistuje žádná lineární závislost. Pro výpočet kovariance používáme vzorec^j!— ^xiyi m^m^ 75 Kovariance Znázornění významu kovariance = 5,5 s12 = -5,5 > i • >• o . 1t2) • ft • O • 2 4 6 8 10 12 14 16 (m1, m2) s12 = 0 1,0 r 0,9 -0,8 0,7 -0,6 y 0,5 -0,4 0,3 0,2 0,1 - 2 4 6 8 10 12 14 16 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 -3 -8 0,0 76 Příklad Příklad: Pro datový soubor obsahující údaje o mezi plasticity (znak X) a mezi pevnosti oceli (znak Y) vypočtěte kovarianci znaků X, Y. Přitom již víme, že m1 = 95,5, m2 = 114,4, s1 =32,4, s2 = 32,5 " 154 17S ' S3 9S 73 7fi l:!:- l-U-l 106 111 77 S5 5S rt li.'? čil 145 im B5 lis ea Í5 ■.■■! 1*7 ■ l "J: i i* 142 113 i n ms LU? 44 fi& tf 97 lítt L Otí sg 11 & .2: li". 99 1L9 Lil 157 Jlli L3S 104 128 L .V) lay 112 125 1IV- 136 155 s& BT 98 140 tf2 £1 41 7í i? ľ LI 5 mi ss 113 lOS 101 72 79 45 B9 v. 93 «6 SI ss 109 :ío 69 42 9] 51 65 132 ■-L7 U3 123 101 114 33 42 35 lul' - saii 76 117 133 1 17 i::: 114 íar 153 na ss inn 12a L49 Řešení: 1 s12 = ' n S xiyi i=1 ■ m1m2 = — (154 • 178 +133 • 164 + ... + 85 • 91)- 95,5 • 114,4 = 985,76 77 Pearsonůvkoeficient korelace Qri2 = — i-L——-2-^íe to průměr součinů standardizovaných hodnot. Počítá se podle vzorce fr12 = — Charakteristika těsnosti závislosti dvou intervalových znaků: Pearsonův koeficient korelace Jsou-li směrodatné odchylky s1, s2 nenulové, pak definujeme Pearsonův koeficient korelace znaků X, Y vzorcem: i=1 s1 s2 Příklad: Pro datový soubor obsahující údaje o mezi plasticity (znak X) a mezi pevnosti oceli (znak Y) vypočtěte koeficient korelace znaků X, Y. Přitom již víme, že m1 = 95,5, m2 = 114,4, s1 =32,4, s2 = 32,5, s12 = 985,76. Řešení: s12 = 985,76 32,4.32,5 Koeficient korelace svědčí o tom, že mezi oběma znaky existuje velmi silná přímá lineární závislost - čím je vyšší mez plasticity, tím je vyšší mez pevnosti a čím je nižší mez plasticity, tím je nižší mez pevnosti. r12 = — = .ľľ!^ = 0,936 Vlastnosti Pearsonova koeficientu korelace: Pro koeficient korelace platí -1 < r12 < 1 a rovnosti je dosaženo právě když mezi hodnotami x1? xn a y1? yn existuje úplná lineární závislost, tj. existují konstanty a, b tak, že yi = a + bxi? i = 1, n, přičemž znaménko + platí pro b > 0, znaménko - pro b < 0. (Uvedená nerovnost se nazývá Cauchyova - Schwarzova - Buň akovského nerovnost.) Tedy čím je r12 bližší 1, tím je silnější přímá lineární závislost mezi znaky X a Y, čím je bližší -1, tím je silnější nepřímá lineární závislost mezi X a Y. Je-li r12 = 1 resp. r12 = -1, pak dvojice (xi? yi) leží na nějaké rostoucí resp. klesající přímce. Hodnoty r12 se nezmění, když u x-ových a y-ových hodnot současně provedeme vzestupnou resp sestupnou lineární transformaci. Hodnoty r12 se vynásobí -1, když u x-ových hodnot provedeme vzestupnou (resp. sestupnou) a u y-ových hodnot sestupnou (resp. vzestupnou) lineární transformaci. Koeficient je symetrický, tj. r12 = r21. 78 Početní pravidla pro číselné charakteristiky Početní pravidla pro číselné charakteristiky o 2 Nechť mi je aritmetický průměr a s i rozptyl znaku X. Pak znak Y = a + bX má: m2 — a + bm1 aritmetický průměr rozptyl 22 Nechť mi, m2 jsou aritmetické průměry, s i , S2 rozptyly a s 12 kovariance znaků X, Y. Pak znak U = X + Y má aritmetický průměr rozptyl s32 = s2 + s2 + 2 s 12 Nechť S12 je kovariance znaků X, Y a mi, ni2 jsou aritmetické průměry znaků X, Y. Pak znaky U = a + bX, V = c + dY mají kovarianci S34 — bdS*i2 79 Příklad Příklad: a) Znak X má aritmetický průměr 2 a rozptyl 3. Najděte aritmetický průměr a rozptyl znaku Y = -1 + 3X. b) Znaky X a Y mají aritmetické průměry 3 a 2, rozptyly 2 a 3, kovarianci 1,5. Vypočtěte aritmetický průměr a rozptyl znaku Z = 5X - 4Y. c) Součet rozptylů dvou znaků je 120, součin 1000 a rozptyl jejich součtů je 100. Vypočtěte koeficient korelace těchto znaků. Řešení: ad a) m2 = -1 + 3m1 = -1 + 3 x 2 = 5, s22 = 32 x s12 = 9 x 3 = 27. ad b) m3 = 5m1 - 4m2 = 5 x 3 - 4 x 2 = 7, s32 = 52 x s12 + (-4)2 x s22 + 2 x 5 x (-4) x s12 = 25 x 2 + 16 x 3 - 40 x 1,5 = 38. ad c) s12 + s22 = 120, s12 x s22 = 1000, s1+22 = 100 = s12 + s22 + 2s12 => s12 = -(s1+22 - s12- s22 )= 2(100 -120) = -10 12 -10 -0,3162. VÍ00Ô 80 Vážené číselné charakteristiky Pokud nemáme k dispozici původní datový soubor, ale jenom tabulku rozložení četností (resp. kontingenční tabulku), můžeme vypočítat tzv. vážené číselné charakteristiky. Vážený aritmetický průměr: m = - V njx[j] Vážený rozptyl: s2 = - V nj (x[j] - m )2 = -1- V njx[j]2 - m2 Vážená kovariance: = 1 VV njk (x[j] - m1 X^[k] - m2 ) = 1VV njkx[j]y[k] - m1m2 81 Příklad Příklad na výpočet vážených číselných charakteristik Z dvourozměrného datového souboru rozsahu 27, vněmž znak X má varianty 1, 2, 3 a znak Y má rovněž varianty 1, 2, 3, byly určeny simultánní absolutní četnosti: 111 = 5, = 1, nn = 3, n21 = 4, n22 = 3, n23 = 4, n31 = 2, n32 = 3, n33 = 2. a) Vypočtěte průměry a směrodatné odchylky znaků X a Y. b) Vypočtěte a interpretujte koeficient korelace znaků X a Y. Řešení: Kontingenční tabulka simultánních absolutních četností: ad a) m1 — (1 • 9 + 2 • 11 + 3 • 7)= — = 1,926. 27 27 2 m2 = — (1 • 11 + 2 • 7 + 3 • 9)= — = 1,926 27 27 x y nj. 1 2 3 1 5 1 3 9 2 4 3 4 11 3 2 3 2 7 n.k 11 7 9 27 s12 =1 (2 • 9 + 2211 + 32 • 7H52 ] =116 - 2704 = s1= 0,766 1 27 V 27 0 27 729 729 s2 = ad b) s12 = 2 JL(2 • 11 + 22 • 7 + 32 • 9)-|^] =120-2704 = í36, s2 = 0,857 27 V 27 0 27 729 729 — (1 • 1 • 5 +1 • 2 • 1 +1 • 3 • 3 + 2 • 1 • 4 + 2 • 2 • 3 + 2 • 3 • 4 + 3 • 1 • 2 + 3 • 2 • 3 + 3 • 3 • 2>- 52 •52 27 27 27 102 - 2704 = 2754 - 2704 = J0_ 27 729 729 729 50 r12 729 428_ 536 729 729 0,10439. 0,0685871 Mezi znaky X a Y existuje velmi slabápřímá lineární závislost. 82 Koeficient variace, geometrický průměr Pro poměrové znaky používáme jako charakteristiku variability koeficient variace —. Je to bezrozměrné číslo, které se často vyjadřuje v procentech. Umožňuje porovnat variabilitu několika znaků. Jsou-li všechny hodnoty poměrového znaku kladné, pak jako charakteristiku polohy lze užít geometrický průměr nJx1 •...• xn . Příklad: Pro datový soubor obsahující údaje o mezi plasticity (znak X) a mezi pevnosti oceli (znak Y) vypočtěte koeficienty variace znaků X, Y. Přitom již víme, že mj = 95,5, m2 = JJ4,4, sj =32,4, s2 = 32,5 Řešení: m sj = 32,4 0,339, cv2 = -2- 32,5 0,284 mj 95,5 m 114,4 83 Výpočty zavedením pomocné proměnné Xi—a > pomocná proměnná ^> vt —- h > konstanty: • a ® střed třídy s nejvyšší četností • h ® šířka třídy 84 Výpočty zavedením pomocné proměnné v =-=^> x = v n + a h 2 2 _sx 2_r2 2 s v — - => sx — n sv h 85 Příklad »* <30 - 40) 10 <40 - 50) 31 <50 - 60) 27 <60 - 70) 19 <70 - 80) 13 Celkem 100 Vypočítejte: • aritmetický průměr, rozptyl, směrodatnou odchylku a variační koeficient zavedením pomocné proměnné 86 Příklad Xi «i mi 35 10 -1 -10 45 31 0 0 55 27 1 27 65 19 2 38 75 13 3 39 Součet 100 X 94 v = 0,94 =^> x = vh + a = 0,94.10 + 45 = 54,4 88 Příklad Xi "i Vi vfn, 35 10 -1 10 45 31 0 0 55 27 1 27 65 19 2 76 75 13 3 117 Součet 100 X 230 sV = - Y (v] nt) - v2 = 2,3 - 0,8836 = 1,4164 ^ s2 = h2 • s,2 = 102 • 1,4164 = 141,64 2 2 v 2 89 Příklad sx =Js2x = V 141,64 = 11,9 nebo sx = h • sv2 = 10 1,4164 = 11,9 s 119 cvx = = —?- = 0,2188 x 55,4 h • sv 10 • 1,19 02188 nebo CVx =-— =-= 0,2188 v • h + a 0,94 • 10 + 45 90 Společný rozptyl 2 —2.2 s = s +S- x s ......vnitroskupinová variabilita (sj )J ......meziskupinová variabilita (s*2 ) ^ Značení ze skript „Popisná statistika" 91 Společný rozptyl r vnitroskupinová variabilita 1 k s =-L si' n n i=1 r meziskupinová variabilita 1 k n i=1 92 Příklad Dl: 104 108 79 155 D2: 93 65 76 111 Vypočítejte: • dílčí průměry, • společný průměr, • dílčí rozptyly, • společný rozptyl. Příklad i n1 1 4 • (104 +108 + 79 +155) = 111,5 x2 =1 • (93 + 65 + 76 +111) = 86,25 4 x = 8 • (111,5 • 4 + 86,25 • 4) = 98,875 94 ..... Příklad 2 = J_A/ t _ _ \2 = S i - / \_: _i I - /2 _1 ^Vvi ^1 i - = 7,52 + 3,52 + 32,52 + 43,52 = ?5425 4 ' 2 6,752 + 21,252 +10,252 + 24,752 303 69 s_ 2--4--303,69 95 Příklad s2 = 1 k -z n 1=1 8 8 • (754,25 • 4 + 303,69 • 4) = 528,97 1 k i=1 2 1 V /- -\2 n n = (111,5 - 98,875)2 • 4) + (86,25 - 98,875)2 • 4 8 = 159,39 96 Příklad 2 —2.2 s = s + sx = = 528,97 +159,39 = 688,36 Pro kontrolu ještě spočteme rozptyl přímo: s2 = -Y x2 - x2 = 1 • 83717 - 98,8752 n i=1 8 = 10464,63 - 9776,27 = 688,36 97 3. Regresní analýza, ^1 Počet pravděpodobnosti Cíl regresní analýzy: vystižení závislosti hodnot znaku Y na hodnotách znaku X. Při tom je nutné vyřešit dva problémy: > jaký typ funkce použít k vystižení dané závislosti > jak stanovit konkrétní parametry zvoleného typu funkce? Typ funkce určíme buď logickým rozborem zkoumané závislosti nebo se snažíme ho odhadnout pomocí dvourozměrného tečkového diagramu. ^ přímka y = A + A x Prťfcě h závislosti -V v*— -64-2 02468 5Z) parabola y = bc + A x + A x x 98 70 60 50 40 30 20 10 0 -10 Regresnípřímka Zde se omezíme na lineární závislost y = |3o+ P ix. Odhady bo a bi neznámých regresních parametrůPo, Pi získáme na základě datového souboru í. \ n J n metodou nejmenších čtverců. Požadujeme, aby výraz — X(yi ~b0 - P1xi)2 nabýval svého minima vzhledem k P o a P i. Tento výraz je minimální, i=1 jsou-li jeho první derivace podle P o a P i nulové. Stačí tyto derivace spočítat, položit je rovny 0 a řešit systém dvou rovnic o dvou neznámých, tzv. systém normálních rovnic. Nechť je dán dvourozměrný datový soubor Výraz q(Po, Pi) = — X(yi - b0 - Pixi)2 se nazývá rozptyl hodnot znaku Y kolem přímky y = Po + Pix, xi yi " y'rj \ xn n a přímka y = Po + Pix. i=i přímka y = b o + b ix, jejíž parametry minimalizují rozptyl q( P o, P i) v celém dvourozměrném prostoru, se nazývá regresní přímka znaku Y na znak X, yi = bo + bixi, i = i, n ... regresní odhad i-té hodnoty znaku Y, ri22 = ID2... index determinace (Index determinace udává, jakou část variability hodnot znaku Y vystihuje regresnípřímka. Nabývá hodnot z intervalu (o, i). Čím je bližší i, tím lépe vystihuje regresnípřímka závislost Y na X.) 99 Odvození odhadů regresních parametrů Systém normálních rovnic získáme derivováním výrazu 1 n q(b0,bi) = -£(yi-P0 -biXi)2 parciálně podle p0 a ^: %^ =2Ž (y,-b o-ft*,X-1)=o * (P 0'bl ) = 2 Ž (y,-b o-bixi)(- >,)=o i=1 Řešením tohoto systému získáme odhady Systém normálních rovnic: Z yixi=bo Z xi+bi Z xl bo = n n n n n n n Zxi2Zyi-ZxiZxiyi nZxiyi-ZxiZyi ^~ 0, dochází s růstem X k růstu Y a hovoříme o přímé závislosti hodnot znaku Y na hodnotách znaku X. Je-li b1 < 0, dochází s růstem X k poklesu Y a hovoříme o nepřímé závislosti hodnot znaku Y na hodnotách znaku X. 2 s Příklad Příklad: Pro datový soubor obsahující údaje o mezi plasticity (znak X) a mezi pevnosti oceli (znak Y) a) Určete regresní přímku meze pevnosti na mez plasticity. b) Zakreslete regresní přímku do dvourozměrného tečkového diagramu. c) Jak se změní mez pevnosti, vzroste-li mez plasticity o jednotku? d) Najděte regresní odhad meze pevnosti pro mez plasticity = 60. e) Vypočtěte index determinace a interpretujte ho. Přitom již víme, že mm = 95,5, m2 = 114,4, si =32,4, s2 = 32,5, s12 = 985,76, r12 = 0,936 . Řešení: ad a) b1 ad b) = si2 2 985,76 1052,4 0,937, b0 = m2 - b1m1 = 114,4 - 0,937 . 95,9 = 24,5, y = 24,5 + 0,937x. mez plasticity ad c) Mez pevnosti vzroste o 0,937 kpcm - viz parametr b1 vypočtený v bodě (a) ad d) y = 24,5 + 0,937 x 60 = 80,72. 101 2 2 2 ad e) ID = ri2 = 0,936 = 0,876. Znamená to, že 87,6% variability hodnot meze pevnosti je vysvětleno regresní přímkou. Příklad Yi Xi2 100 120 12 000 10 000 90 105 9 450 8 100 86 95 8 170 7 396 94 100 9 400 8 836 120 135 16 200 14 400 135 140 18 900 18 225 79 102 8 058 6 241 62 98 6 076 3 844 110 125 13 750 12 100 125 134 16 750 15 625 1 001^ k154 118 754 > 104 767 1154 = 10 • b0 +1001 • b 118754 = 1001 • b0 +104767 • b1 44,41 + 0,709 • x 102 2 Příklad Index determinace lze vyíádřit ve tvaru: Vi /v Vi2 y2 100 120 115 14 400 13 301 90 105 10S 11 025 11 715 s6 95 105 9 025 11 109 94 100 111 10 000 12 337 120 135 130 18 225 16 773 135 140 140 19 600 19 642 79 102 100 10 404 10 088 62 9s ss 9 604 7 811 110 125 122 15 625 14 987 125 134 133 17 956 17 704 1 GG1 1 154 1 154 135 864 135 468 ID2= zy 2 - n-(zy. ľ z y2 - n-(z y> ľ 135468 - — 11542 ID2 =-10- 135864 - — •11542 10 0,853 1Ü3 Maticové vyjádření MNC b XT • y b 0 b 1 l~1 X 1 X n y y1 y n b sloupcový vektor 2 neznámých parametrů regresní funkce, X matice rozměru n x2 , tvořená konstantou 1 a hodnotami znaku X y sloupcový vektor n hodnot znaku Y 104 Příklad Nalezněte koeficienty regresnípřímky: XT y = " 120 105 95 100 135 140 102 98 125 _ 134 _ X 1 100 1 90 1 86 1 94 1 120 1 135 1 79 1 62 1 110 1 125 1111111111 1 100 90 86 94 120 135 79 62 110 125 105 Příklad g XT*y= r 1154 118754 A = XT*X= r 10 1001 1001 104767 1 _l A-1 = r 2,2941 -0,0219 -0,0219 0,0002 b =A-1*g= 44,414 0,709 106 Sdružené regresnípřímky Vněkterých situacích má smysl zkoumat nejenom závislost znaku Y na znaku X, ale též závislost X na Y. Vtakovém případě hledáme druhou regresnípřímku a souhrnně hovoříme o sdružených regresních přímkách. Regresnípřímkou znaku X na znak Y nazveme tu přímku x = b0 + , jejíž parametry minimalizují rozptyl q( P0, P1 ) = n _ _ Z(xi -P0 - P1yi)2 v celé rovině. Nazývá se též druhá regresnípřímka. Regresnípřímka znaku Y na znak X a regresnípřímka i=1 znaku X na znak Y se nazývají sdružené regresnípřímky. Rovnice regresnípřímky znaku X na znak Y má tvar: 107 Vlastnosti sdružených regresníchpřímek Sdružené regresní přímky se protínají v bodě (m15m2). Pro regresní parametry b1,b1 platí: b1b1 = r122. Rovnice sdružených regresních přímek můžeme psát ve tvaru s2(x m) y = m , 1s2(x _ m1) (je-li ŕ 0). s ri2 si Regresní přímky svírají tím menší úhel, čím méně se od sebe liší r12 a A12 2 Regresní přímky splynou, je-li r12 = 1. K tomu dojde právě tehdy, existuje-li mezi X a Y úplná lineární závislost. Všechny body (xi, yi), i = 1, n leží na jedné přímce, tedy ze znalosti xi můžeme přesně vypočítat yi, i = 1, n. Jsou-li znaky X, Y nekorelované, pak mají sdružené regresní přímky rovnice y = m2, x = m1 a jsou na sebe kolmé. Označíme-li a úhel, který svírají sdružené regresní přímky, pak platí: cos a = 0, právě když mezi X a Y neexistuje žádná lineární závislost, cos a = 1, právě když mezi X a Y existuje úplná přímá lineární závislost, cos a = -1, právě když mezi X a Y existuje úplná nepřímá lineární závislost. 108 1 Příklad Příklad: Pro datový soubor obsahující údaje o mezi plasticity (znak X) a mezi pevnosti oceli (znak Y): a) Určete regresnípřímku meze plasticity na mez pevnosti. b) Zakreslete tuto druhou regresnípřímku do dvourozměrného tečkového diagramu. Přitom již víme, že m1 = 95,5, m2 = 114,4, s1 =32,4, s2 = 32,5, s12 = 985,76, r12 = 0,936 . Řešení: — s 985 76 — — ad a) b1 = ^f- =-i— = 0,932,b0 = m1 - b1m2 = 95,9 - 0,932 x 114,4 = -10,7, tedy x = -10,7 + 0,932y. s2 1057,21 ad b) 170 1EO- u "ffi 110- -.......—■*......—l.llljli...........j--------■■■ ........j I........I _ .......—j.... .....!- í j -l—f— ! sú 70 00 110 130 150 170 ÍSQ m&z pevnosti 109 Příklad Poptávka po vepřovém mase 154 164 123 181 105 143 167 158 62 Poptávka po hovězím mase 103 116 98 175 165 90 103 J40_ 113 49 • Sestrojte sdružené regresnípřímky. • Vypočtěte koeficient korelace. 110 Příklad Xj yj xj*yj xj2 yj2 154 103 15 862 23 716 10 609 164 116 19 024 26 896 13 456 123 98 12 054 15 129 9 604 181 175 31 675 32 761 30 625 193 165 31 845 37 249 27 225 105 90 9 450 11 025 8 100 143 103 14 729 20 449 10 609 167 140 23 380 27 889 19 600 158 113 17 854 24 964 12 769 62 49 3 844 2 401 1 45^1 152^,178 911 \ 223 9221 144 998 *1 - *1 - 1187.1 1367.2 " 1187,1 1228,76 0,868 s m1 - 10 •1450 -145 m2 - 10 •1152 -115,2 S 2 - 1 10 1 12 10 v4J891j1 - 10 • 223922 _ 1452 -1367,2 •144998 -115,22 -1228,76 _ 145 • 115,2 - 1187,1 0,966 Z>0 -115,2 - 0,868 • 145 Z>0 -145 - 0,966 • 115,2 -10,66 33,72 111 1 1 Příklad y = -10,66 + 0,868• x ::"::::::::"::::::::"::::::::"::::::^ x = 33,72 + 0,966 • y o O) re E > 0 1 175 155 135 115 95 75 55 35 15 Sdružené regresní přímky 45 65 85 105 125 145 165 185 205 Vepřové maso 112 Příklad Yjxiyrnmim2 [IV~^ 2TJV 2 2 rl2 S12 S l ' S 2 rl2 = sgn(t>i) ^ -i 113 Příklad 178911 -10 • 145 • 115,2 nn„ r12 = /r ir = 0,916 P23922 -10 • 1452 J J44998-10 • 115,22 J = 1187,1 = 0,916 12 36,976 • 35,054 r12 =V0,868 • 0,966 = 0,916 114 Příklad Yi 154 103 164 116 123 98 52 175 193 165 105 90 143 103 167 140 158 113 191 49 • Sestrojte sdružené regresnípřímky. • Vypočtěte koeficient korelace. • Porovnejte výsledky s výsledky předchozího příkladu. 115 Příklad Xj2 Yi2 154 103 15 862 23 716 10 609 164 116 19 024 26 896 13 456 123 98 12 054 15 129 9 604 52 175 9 100 2 704 30 625 193 165 31 845 37 249 27 225 105 90 9 450 11 025 8 100 143 103 14 729 20 449 10 609 167 140 23 380 27 889 19 600 158 113 17 854 24 964 12 769 191 49 9 359 36 481 2 401 1 450 1 152 162 657 226 502 144 998 průměry 145,0 115,2 rozptyly 1625,2 1228,76 směrodatné odchylky 40,3138 35,0537 r = -V0,270 • 0,357 =-0,310 y = 154,31 - 0,270 • x x = 186,09 - 0,357 • y Sdružené regresní přímky > O X 175 155 135 115 95 75 55 35 15 45 65 85 105 125 145 165 185 205 Vepřové maso 116 Příklad Rozhodněte zda následující dvojice přímek mohou být sdruženými regresními přímkami: A) y = 13 - 2 x B) y = 13 - 2 x C) y = 13 - 2 x x = 2,5 x = 0,4 y x = 8 - y D) y = 13 - 2 x E) y = 13 - 2 x F) y = 13 - 2 x x = 6,5 - 0,5 y x = -2 - 0,4 y x = -0,5 y 117 Příklad A) y = 13 _ 2 x x = 2,5 D) y = 13 _ 2 x x = 6,5 _ 0,5 y B) y = 13 _ 2x C) y = 13 _ 2x x = 0,4y x = 8 _ y E) y = 13 _ 2 x F) y = 13 _ 2 x x = _2 _ 0,4y x = _0,5 y i Z>. mají stejná znaménka 2. je-li jeden roven nule, pak je 0-vý i druhý 3. re[_ 1,1] ,tj. b • b e [0,1] 4. pro r=1/r=-1 platí b0 = b A) NE(2) B) NE(1) C) NE(3) D) ANO E) ANO F) NE(4) 118 Počet pravděpodobnosti -úvod Počet pravděpodobnosti se zabývá studiem zákonitostí v náhodných pokusech. Matematickými prostředky modeluje situace, v nichž hraje roli náhoda. Pod pojmem náhoda rozumíme působení faktorů, které se živelně mění při různých provedeních téhož pokusu a nepodléhají naší kontrole. Počet pravděpodobnosti jako vědecká disciplína se začal vytvářet v 17. století a jeho počátky jsou spjaty se jmény Blaise Pascala, Pierra de Fermata, Christiana Huygense (studovali hazardní hry, zformulovali takové pojmy, jako je pravděpodobnost a střední hodnota, odvodili jejich vlastnosti) a především Jakoba Bernoulliho (dokázal zákon velkých čísel). V 18. století: Abraham de Moivre a Pierre Simeon Laplace - formulace jedné z forem centrální limitní věty, Georges Buffon odvodil binomickou větu, zavedl diferenciální a integrální počet do teorie pravděpodobnosti, Thomas Bayes odvodil způsob výpočtu aposteriorních pravděpodobností pomocí apriorních pravděpodobností (Bayesův vzorec). V 19. století: Petrohradská matematická škola - dala teorii pravděpodobnosti pevný logický a matematický základ (Viktor Jakovlevič Buňakovskij, Pafnutij Lvovič Cebyšev, Andrej Andrejevič Markov, Alexandr Michailovič Ljapunov), Karl Fridirich Gauss (mj. vyvinul netodu zpracování experimentálních údajů známou pod názvem metoda nejmenších čtverců), Siméon Denis Poisson (zobecnil Bernoulliho zákon velkých čísel a odvodil speciální zákon rozložení pravděpodobností - Poissonův zákon rozložení). Ve 20. století: Andrej Nikolajevič Kolmogorov (axiomatická teorie pravděpodobnosti), Norbert Wiener , William Feller (rozvoj reorie stochastických procesů). Odkaz na zajímavou webovou stránku: http://www-groups.dcs.st-and.ac.uk/~history 119 http://turnbull.mcs.st-and.ac.uk/~history/HistTopics/Statistics.html Základní prostor Definice (definice pokusu): Pokusem rozumíme jednorázové uskutečnění konstantně vymezeného souboru definičních podmínek. Předpokládáme, že pokus můžeme mnohonásobně nezávisle opakovat za dodržení definičních podmínek (ostatní podmínky se mohou měnit, proto různá opakování pokusu mohou vést k různým výsledkům). Dále předpokládáme, že opakováním pokusu vzniká opět pokus. Deterministickým pokusem nazýváme takový pokus, jehož každé opakování vede k jedinému možnému výsledku. Náhodným pokusem nazýváme takový pokus, jehož každé opakování vede k právě jednomu z více možných výsledků, které jsou vzájemně neslučitelné. Příklad deterministického pokusu: při tlaku 1015 hPa zahříváme vodu na 100 °C. Jediným možným výsledkem je var vody. Příklady náhodných pokusů: hod hrací kostkou, hod mincí, vylosování čísla z osudí apod. Definice (definice základního prostoru): Neprázdnou množinu možných výsledků náhodného pokusu značíme w a nazýváme ji základní prostor. Možné výsledky značíme wt, kde t e t , t je indexová množina. 120 Příklad Příklad a) Náhodný pokus spočívá v hodu kostkou. Možný výsledek ©i znamená polohu kostky číslem i nahoru, i = 1, ..., 6. Základní prostor Q = ...,©6}, počet možných výsledků m(w) = 6. b) Náhodný pokus spočívá v hodu dvěma kostkami. Možný výsledek je uspořádaná dvojice © j J, i, j = 1, 6. Základní prostor Q = {[©1,©1 J,[©1,©2J,...,[©1,©6J,[©6,©6J}, počet možných výsledků m(w) = 62 = 36. c) Náhodný pokus spočívá v opakovaném házení mincí tak dlouho, dokud nepadne první líc. Potom základní prostor Q = {©1,©2,©3...}, kde ©1 znamená, že hned v prvním hodu padl líc, ©2 znamená, že až ve druhém hodu padl líc, ©3 znamená, že až ve třetím hodu padl líc atd. Sybmolicky lze zapsat ©1 =[lJ, © 2 = [r,lJ , © 3 = [r,r,lJ , ... Tedy základní prostor q má nekonečně spočetně mnoho možných výsledků. 121 Jevové pole Definice (definice jevového pole): Systém podmnožin A základního prostoru w , který splňuje následující tři axiómy: J5: a—,a2 e A => a— -a2 e A , J6: We A , J8: ai,a2,... e A == (j ai e A i=i se nazývá jevové pole. Jestliže A e A , pak řekneme, že A je jev. Dvojice (W, A ) se nazývá měřitelný prostor. (Axióm J5 nám říká, že jevové pole obsahuje s každými dvěma množinami i jejich množinový rozdíl. Axióm J6 říká, že jevové pole obsahuje celý základní prostor a konečně axióm J8 říká, že když jevové pole obsahuje každou ze spočetné posloupnosti množin, obsahuje i jejich spočetné sjednocení. Znamená to, že systém A je uzavřený vzhledem k množinovým operacím. Protože jevy jsou množiny, pro operace s nimi platí stejné zákony jako pro operace s množinami -komutativní zákon, asociativní zákon, de Morganova pravidla.) 122 Množinové a pravděpodobnostní pojmy Poznámka (slovník množinových a pravděpodobnostních pojmů) w se nazývá jistý jev, 0 se nazývá nemožný jev w g a znamená, že možný výsledek co je příznivý nastoupení jevu A a c b znamená, že jev A má za důsledek jev B a u b znamená nastoupení aspoň jednoho z jevů A, B a n b znamená společné nastoupení jevů A, B a - b znamená nastoupení jevu A za nenastoupení jevu B A = w - a znamená jev opačný k jevu A a n b = 0 znamená, že jevy A, B jsou neslučitelné. 123 Príklad Příklad: Je dán systém složený ze dvou bloků, který jednorázově použijeme. Nechť jev ai znamená bezporuchovou funkci i-tého bloku, i = 1, 2. Pomocíjevů a15a2 vyjádřete jevy: a) bezporuchová funkce aspoň jednoho bloku: a1 u a2 b) bezporuchová funkce obou bloků: a1 n a2 c) porucha aspoň jednoho bloku: a1 u a2 d) porucha obou bloků: a1 n a2 e) porucha právě jednoho bloku: a n a2 )u(a1 n a2 ) 124 Jevové pole - poznámky Poznámka: Systém axiómů jevového pole je bezesporný (tj. na každém základním prostoru lze sestrojit aspoň jedno jevové pole) a neúplný (tzn., že na každém aspoň dvouprvkovém základním prostoru lze vytvořit jevových polí více). Neúplnost systému axiómů jevového pole je výhodná, protože umožňuje rozlišovat výsledky náhodného pokusu srůzným stupněm podrobnosti. Např. jevové pole A min = {Q0} se nazývá minimálníjevové pole a charakterizuje krajně „tupozrakého" pozorovatele, který rozlišípouze jev jistý a jev nemožný. Jevové pole A 1= {w,0,a,a} již dovolí rozeznat, zda nastal jev a nebo jev opačný a . Tak můžeme konstruovat stále bohatšíjevová pole, až dostaneme maximální jevové pole A max = {a; a í q}. To charakterizuje krajně „bystrozrakého"pozorovatele, který rozlišíjevy do všech podrobností. Pro libovolnéjevové pole A ovšem platí: A min í A í A max. 125 Příklad Příklad: Sestrojte všechna možná jevová pole na základním prostoru W = w 2, w3}. Řešení: A i = {W,0}(= A min) A 2 = {W,0, {©i}, {w2,w3}} A 3 = {W,0,{w2},{©i,w3}} A 4 = {W, 0, }, {wi, w2}} A 5 = {Í2,0, {wi},{w2}, {wi,w2}, {w3} {wi,w3}{w2'w3 }}(= A max) 126 Jevové pole - vlastnosti Věta (vlastnosti jevového pole): Nechť (w , A) je měřitelný prostor. Pak jevové pole A má následujících 9 vlastností: J1: A *0, J2: 0e A , J3: Ä1,Ä2 e A == A1 u A2 e A , J4: A1,A2 e A == A1 n A2 e A , J5: A1,A2 e A == A1 -A2 e A (axióm), J6: We A (axióm), J7: a e A == A e A , J8: A1,A2, ... e A == i)Ai e A (axióm), J9: Al5A2, ... e A == H A i=1 e A Důkaz: J1 plyne zJ6. J2 plyne zJ5 a J6, protože w - w = 0. J3 plyne zJ2 J8 speciální volbou A3 =0,A4 i=1 J7 plyne J5 a J6, protože a = w - a . J9 odvodíme zJ7 a J8 užitím de Morganových pravidel I Ai = U Ai 0,k Pak U Ai = A1 u A i=1 i=1 _ _ ¥ _ ¥ _ ¥ _ ¥ Ai,A2,k e A == Al9A29 k e A == U Ai e A = U Ai e A , OVŠem U Ai = H A i=1 i=1 i=1 i=1 J4 plyne zJ9 speciální volbou a3 = w,a4 =w, ^ 127 ¥ Pravděpodobnostní prostor Motivace: Provádíme opakovaně nezávisle týž náhodný pokus a v každém pokusu sledujeme nastoupeníjevu A, kterému říkáme úspěch. Označme n celkový počet pokusů a N(A) počet těch pokusů, kdy nastal úspěch. S rostoucím n pozorujeme, že relativní četnost úspěchu n(a ) n se blíží číslu P(A), které považujeme za pravděpodobnost úspěchu. (Tento poznatek je znám jako empirický zákon velkých čísel). Ilustrace empirického zákona velkých čísel Provádíme n nezávislých hodů mincí. Padnutí líce považujeme za úspěch. Budeme sledovat závislost relativní četnosti úspěchu na počtu pokusů. (Počet pokusů volíme 2, 5, 10, 20, 50, 100, 200, 500,1000, 2000.) n 2 5 10 20 50 100 200 500 1000 2000 p 0,5 0,2 0,4 0,6 0,54 0,58 0,5 0,488 0,49 0,4975 0,65 0,60 0,55 0,50 0,45 0,40 0,35 0,30 0,25 0,20 0,15 0 o o o o 128 o ro -P>- O 00 o ro o 11 o o o o o o t3 2 o 0 Axiomatická teorie pravděpodobnosti ■ Vzniká otázka, jak zavést pravděpodobnost, aby byla „zidealizovaným" protějškem relativní četnosti.Zdálo by se vhodné zavést pravděpodobnost takto: P(A )= y,, ííM. Jde o tzv. statistickou definici pravděpodobnosti. Z matematického hlediska tato definice není v pořádku, protože počet pokusů je vždy konečný a nelze se přesvědčit o exstenci uvedené limity. Proto ve 30. letech 20. století ruský matematik A. A. Kolmogorov (1903- 1987) vybudoval axiomatickou teorii pravděpodobnosti. Axiomatickáteorie pravděpodobnosti zavádípravděpodobnost jako funkci, kterákaždému jevu přiřazuje číslo mezi 0 a 1 a přitom je zidealizovaným protějškem relativní četnosti. Má tedy všechny vlastnosti relativní četnosti a kromě toho některédalšívlastnosti, kterévyplývajízvnitřních potřeb matematickéteorie. 129 Pravděpodobnost - definice Definice: Nechť ( w , A ) je měřitelný prostor. Reálná množinová funkce P: A — R se nazývá pravděpodobnost, když splňuje následující 3 axiómy: P2: "a g A : p(a)> o (nezápornost) P10: p(w)= i (normovanost) ŕ O \ 00 P15: a19a2, ... g A jsou neslučitelné == p ii aí =X p(a ) (spočetnáaditivita) V i=I 0 i=l Trojice ( w , A , P)se nazývá pravděpodobnostní prostor. (Je to matematický model jednorázového provedení náhodného pokusu.) Ilustrace pravděpodobnostního prostoru Poznámka: Systém axiómů pravděpodobnostije bezesporný (tj. na každém měřitelném prostoru lze sestrojit pravděpodobnost) a neúplný (tj. na každém měřitelném prostoru, jehožjevové pole není minimální, lze sestrojit pravděpodobností více). 130 Pravděpodobnost - vlastnosti Věta (vlastnosti pravděpodobnosti): Nechť (q , A , P) je pravděpodobnostní prostor, a,a15a2 libovolné jevy. Pak pravděpodobnost P má následujících 17 vlastností: Pl: P( 0) = 0 P2: P(A) > 0 (nezápornost - axióm) P3: p(a1 u A2) + P(Al n A2) = P(Al) + P(A2) P4: l + P(Al n A2) > P(Al) + P(A2) P5: P(Al u A2) < P(Al) + P(A2) (subaditivita) P6: Al n A2 = 0 => P(Al u A2) = P(Al) + P(A2) (aditivita) P7: P(A2 - Al) = P(A2) - P(Al n A2) P8: Al í A2 => P(A2 - Al) = P(A2) - P(Al) (subtraktivita) P9: Al c A2 => p(a2) < P(Al) (monotonie) Pl0: P(H) = l (normovanost - axióm) Pll: p(a) + P( a ) = l (komplementarita) Pl2: P(A) < l í ¥ V ¥ Pl3: p Uai <^p(aí) (spočetná subaditivita) ¥ Pl4: a1?a2,...e A jsou neslučitelné p(aí)<¥ (absolutní konvergence) ¥¥ Pl5: a1?a2,... e A jsou neslučitelné p Uai =^p(aí) (spočetná aditivita - axióm) Pl6: a1 í a2 í ...e A p Uai = limp(ai) (spojitost pravděpodobnosti zdola) Pl7: a1 3 a2 3...e A p(f)ai1 = limp(ai) (spojitost pravděpodobnosti shora) , ... e A 131 Vi=1 J Pravděpodobnost - vlastnosti 132 Pravděpodobnost -vlastnosti Pro důkaz vlastností P3: P4 a P5 jevy A\ UA2. A\ a A-z rozložíme na součet disjunktních sčítanců: A] U A2 = (Ai \ A2) U (Ai n A2) U (A2 \ Ai) A1 = (A1 \ A2) U (Ax n A2) A2 = (A2 \ Ai) U (Ai n A2) P3 Podle P(i dostáváme: P(.41U42)+P(A1nA2) = P(.41\A2)+P(A1 n A2) + P(A2 \ .40 4- P(AX n A2) = P(A0 4- P(A2). Protože podle P12 je P(Ai U A2) < 1 a podle P2 je P(Ai n A2) > 0, dostáváme z P3 okamžitě P4 a P5. P7 Opět vyjádříme A2 jako sjednocení neslučitelných jevu: A2 = (A2 \Ai) U (Ai n A2). Podle P3 pak dostaneme: P(A2) = P(A2 \ Ax) 4- P(A: f~l Aa), tedy P(A2\A1) =P(A2)-P(A1DA2). P8 Jelikož AI C A2; platí Ai n A2 = Ai a P8 plyne z P7. P9 Plyne z P8. protože podle P2 je P(A2\A0 > 0. tudíž PiA^-P^) > 0. tj-P(A,) oq P17 Podle vlastnosti Plfi dostáváme P( \J A^) = liru P(j4j). Z de Morgano- _ 7=1 vých pravidel plyne P( f] A{) = P( U ^0 - 1 - P( U ^) : : 1 " 1™ ^(^i) : 1 - lim [1 - P{Ai)] = jim P(Ai). 7—>00 7—>oc 134 Pravděpodobnost -vlastnosti Věta (další vlastnosti pravděpodobnosti): Nechť (o 9 A , P) je pravděpodobnostní prostor, Aj,a2,...,an e a libovolnéjevy. Pak platí: n _1 n i=1 i=1 i=1 j=i+1 a) P( U A ) = Žp(ai) _ZZp(ai n aj) + Ž ZZ p(ai n aj n ak) _... + (_1)n_1p(a1 n... n an) i=1 j=i+1 k=j+1 (Pro neslučitelnéjevy Ai, An dostáváme P(Uai) = Xp(ai).) (Věta o sčítání pravděpodobností) i=1 i=1 b) maxp(ai)£p|UAí NEpCa) 1\ c) 1 _ n + Ž P(Ai)£ P I Ai i=1 V i=1 0 min 1 iS p (Aľ)= i -Z& - p(Aí )]=i - n + S p (aí ) , A n+2 , Vi=i J Pravá strana: Plyne z monotonie P9. Pro "i e {,...,n} je Ai 21Aj, tedy pro "i e {,...,n} platí p(aí)> p 1 Aj . Tvrzení musí platit i pro ten index i, pro který je p(aí) minimální. 136 Příklad Příklad: Je dán systém složený ze dvou bloků. Jev Ai značí bezporuchovou funkci i-tého bloku, i = 1, 2. Je známo, že p(aí)=ji? i = 1, 2. a) Odhadněte pravděpodobnost správné funkce celého systému, jsou-li bloky zapojeny a) sériově, p) paralelně. b) Předpokládejme navíc, že p(a1 n a2 ) = j12. Vypočtěte nyní pravděpodobnost správné funkce celého systému, jsou-li bloky zapojeny a) sériově, p) paralelně. Řešení: ad a) případ sériového zapojení p(a1 n a2 ) lze shora i zdola odhadnout pomocí věty 2.5. (c), kde n = 2: i - 2 + P(A1)+ P(A2) £ P(A1 n A2) £ min{p(Ai ),P(A2)} Ji + J 2 -1 £ P(A1 n A2 )£ min{ji; J 2} Příklad Případ paralelního zapojení p(a! u a2 ) lze shora i zdola odhadnout pomocí věty 2.5. (b), kde n = 2: max{P(A,),P(A2)} £ P^, u A2) £ )+ P(A2) max{jj, J2 }£ P(Aj u A2)£ Jj + J2 ad b) Případ sériového zapojení: p(a1 n a2 )= j12 Případ paralelního zapojení: Podle vlastnosti P3 dostáváme: p(a1 u a2 )=p(a1 )+p(a2 )-p(a1 n a2 )= j1 + j 2 -s12 138 4. Diskrétní pravděpodobnost. Stochasticky nezávislé jevy. Motivace: V Kolmogorovově axiomatické definici pravděpodobnosti se nespecifikuje jak na daném měřitelném prostoru (í, A) zkonstruovat pravděpodobnost P. Jednou z možností je zavedení tzv. diskrétní pravděpodobnosti. Používá se v situacích, kdy pouze spočetně mnoho možných výsledků náhodného pokusu má reálnou šanci na uskutečnění. Šance těchto výsledků se ohodnotívahami a pravděpodobnost jevu se pak získájakou součet těch vah možných výsledků, kteréjsou příznivénastoupenídaného jevu. Jestliže je možných výsledků pouze konečně mnoho a všechny majístejnou šanci na uskutečnění, dostáváme klasickou pravděpodobnost jako speciálnípřípad diskrétnípravděpodobnosti. 139 Konstrukce diskrétní pravděpodobnosti Označení:Nechť m ^0,b í M,g:m ,) je funkce, kteráje všude nulová svýjimkou nejvýše spočetné množiny G í m . Pak symbol Z g (x) má tento význam: a) Je-li b n g = 0, pak Z g (x )= 0. b) Je-li b n g konečná množina, pak prvky tohoto průniku uspořádáme do konečné posloupnosti (x1,...,xn} a Z g(x )=£g(xi). xeB i=1 c) Je-li b n g spočetná množina, pak prvky tohoto průniku uspořádáme do spočetné posloupnosti {x1,x2,...} a 00 Zg(x)=Zg(xi), pokud tato suma absolutně konverguje. Není- li podmínka absolutní konvergence splněna, xeB i =1 nemáuvedený symbol smysl. Je-li b = ¥) nebo b = (_¥,x), pak píšeme Z g(x )= Z g(x) Zg(x)=Zg() xeB x=_¥ xeB t < x 140 Konstrukce diskrétní pravděpodobnosti Definice (definice diskrétní pravděpodobnosti): Nechť (Q, A ) je měřitelný prostor, rcfi nejvýše spočetná podmnožina základního prostoru. Funkce y: Q ® R, kteráje kladná pouze na r a jinak je nulová a splňuje podmínku £y(<»)= 1, se nazývá váhová funkce. Reálná množinová funkce P: A — R daná vzorcem Věta: Diskrétní pravděpodobnost je pravděpodobnost ve smyslu axiomatické definice, tzn., že má vlastnosti P1 -P17. Důkaz: Stačí ověřit platnost axiómů P2, P10, P15. P2: P(A) > 0- plyne z definice váhové funkce. P10: p (Q)=2Mw)= 1 - splněno. P15: a1,a2,... e A jsou neslučitelné == pIJ ai = 2M a = 0, p(a)= i <=> a = w. Důkaz: Klasická pravděpodobnost je speciálním případem diskrétní pravděpodobnosti s vahami y(w) i Poslednídvě implikace vyplývajízdefiniceklasicképravděpodobnosti. 143 Příklad Dřevenou, natřenou krychli o straně 4 cm rozřežeme na jednotkové krychličky. Jaká je pravděpodobnost, že náhodně vybraná krychlička a) má právě 2 natřené stěny, b) nemá žádnou natřenou stěnu? Řešení: p (A) p (a) 8 • 3 64 .2164 3 8 8 144 Příklad 1) Jakáje pravděpodobnost, že slovem náhodně sestaveným z písmen A, A, A, E, I, K, M, M, T, T bude MATEMATIKA? Řešení: P(A) 31-21-2! 10! 151200 2) Jakáje pravděpodobnost, že z n lidíněkteří dva slaví narozeniny ve stejný den (n < 365)? p (a) = 1 - p ( a ) = 365:364(365 - n+1) 365! 365n (365 - n)l • 365' Přes pravděpodobnost 1/2 se dostaneme užpři n = 23: n 10 20 22 23 30 40 50 60 P 0/117 0,411 0,476 0,507 0,706 0,891 0,870 0,994 145 1 Příklad Příklad: V dodávce 100 kusů výrobků nemá požadovaný průměr 10 kusů, požadovanou délku 20 kusů a současně nemá požadovaný průměr i délku 5 kusů. Jaká je pravděpodobnost, že náhodně vybraný výrobek z této dodávky má požadovaný průměr i délku? Řešení: Jev A spočívá v tom, že výrobek má požadovaný průměr a jev B v tom, že výrobek má požadovanou délku. Počítáme P(A n B) = P(AUB) = 1 - P(A u B) =1 - [P(A) + P(B) - P(A n B)] 1 - 10 20 0,75 L100 100 100, Pravděpodobnost, že náhodně vybraný výrobek z dodávky má požadovaný průměr i délku, je 0,75. 146 Příklad Jsou dány dvě různé rovnoběžnépřímky a, b. Na a je n různých bodu A1? . . . ,An, na bm různých bodu B1? . . . ,Bm. Jaká je pravděpodobnost, že 3 náhodně vybrané body tvoří trojúhelník? Řešení: f n Y m ^ f n Y m ^ + P (A) 1 2 n + m ^ 3 0 mn(n -1) nm(m -1) 2 + 2 (m + n)(m + n -1)(m + n - 2) 3 • 2-1 3mn (m + n)(m + n -1) 147 Příklad Po číselné ose se posuneme o jedničku vpravo, nebo vlevo, podle toho, zda nám na minci padne rub, nebo líc. Začínáme v 0. Jakáje pravděpodobnost, že po 2n krocích budeme v 0? Rešem: Pravděpodobnostním prostorem mohou být posloupnosti nul a jedniček délky 2n (označující kam v kterém kroku jdeme). Abychom po 2n-tém kroku stáli v nule, musíme jít v průběhu stejněkrát (tj. n krát) doleva a n krátdoprava: ( 2n \ P (A) (101 , 5 J 10•9•8•7•6 63 Např. pro n=5 (2n=10): P(A) 210 5 • 4 • 3 • 2-1024 256 0,246 148 Příklad Čísla 1, . . . , n promícháme. Jakáje pravděpodobnost, že aspoň jedno číslo bude na svém místě? Najděte její limitu při n —oo. Řešení: Nechť jev Ai je „číslo i na svém místě". Podle vzorce pro sjednocení 149 Příklad Příklad 4> : Z množiny (al;...,an} zvané základní soubor rozsahu n vybereme k-krát po jednom prvku, který vždy vrátíme zpět. Získáme uspořádanou k-tici [aii, ... ,aik ], která se nazývá uspořádaný výběrový soubor rozsahu k s vracením. Předpokládáme, že v základním souboru je právě r prvků označeno, r < n. Zavedeme jevy a1,b1,c1 takto: A1 ... jev, že každý z prvků základního souboru se ve výběrovém souboru ocitne nejvýše lx, Bl ... jev, že předem pevně daný prvek základního souboru se ve výběrovém souboru ocitne aspoň lx, c1 . jev, že ve výběrovém souboru se ocitne právě x označených prvků, x < k . v Řešení: w1 ... množina všech uspořádaných k-tic utvořených z prvků al,k,an, kde se prvky mohou opakovat, m(Wl ) = nk. Jevu Al jsou příznivé ty k-tice, kde se prvky neopakují, tedy m(Al ) = n (n - i)(n - 2)-... (n - k +1). p(Ai )= n (n - Q-... k(n - k +l) l V l — 21 1 - n0 i - k -1 n ■n i=i v b1 ... jev, že předem pevně daný prvek základního souboru se do výběrového souboru vůbec nedostane. Jevu B jsou příznivé ty k-tice, ve kterých se daný prvek vůbec nevyskytuje. Je zřejmé, že m (B )= (n - i)k. Pak P(Bi)= l - P(B)= l= l-íl -J Jevu Cl jsou příznivé ty k-tice, které mají na x místech označené prvky a na zbylých k-x místech neoznačené prvky. Pak m(Cl) = rx (n - r)k 01A V x 0 P (Ci ) = V x 0 rx(n-r)k-x í k ^ í r 1 x í l -V r 1 k-x Vx0 V n 0 n 0 150 n n Příklad Příklad Za jinak stejných podmínek jako v př. «§1 . nevracíme vybrané prvky zpět do základního souboru (předpokládáme, že k < n, x < r). Získanou uspořádanou k-tici nazveme uspořádaný výběrový soubor rozsahu k bez vracení. Jevy a2,b2,c2 jsou definovány stejně jako v př. 4. . Vypočtěte jejich pravděpodobnosti. Řešení: w2 ... množina všech uspořádaných k-tic utvořených z prvků a1;...,an, kde se prvky nemohou opakovat, (n -1)! P(B2 ) = 1 - P (B7 )= 1 -í^> = 1 - n-kk n n (n - k) r! (n - r) k "i k! r! (n - r) n! x J = x! (k - x)' (r - x)' (n - r - k + x) n! (n - k) (n - k) 151 Příklad Příklad «k*«d: Za jinak stejných podmínek jako v př. . považujeme za výběrový soubor rozsahu k bez vracení nikoliv uspořádanou k-tici, ale podmnožinu {aii,... ,ain}. Vypočtěte pravděpodobnosti jevů a3,b3,c3. Řešení: w 3 ... množina všech neuspořádaných k-tic utvořených z prvků ai,... ,an, kde se prvky nemohou opakovat, m(W2 )= k . V k 0 ,p(A3 ) = i ín - il (n -1)! A3 = w3 P(B3) = 1 - P(B3 )= 1 - Vk0 n Vk0 = 1 - k!(n -1 - k) = 1 - n - k = k n! nn k! (n - k)! P(C3 ) = í r V n - r 1 V0Vk-x0 n Vk0 Dospěli jsme ke stejným výsledkům jako v příkladě , i když jsme použili jiný model. Je to způsobeno tím, že v př «3»«1» . jsme použili variace bez opakování a v př.«§»£«2» kombinace bez opakování. Každé kombinaci {aii,... ,aik} odpovídá právě k! variací. 152 Příklad I Poznámka: Nemá smysl uvažovat o kombinacích s opakováním. Model by byl nerealistický, protože možné výsledky pokusu by neměly stejnou šanci na uskutečnění. Např. kombinaci {t1;...,ak} odpovídá k! variací (s opakováním), zatímco kombinaci &15...,a1} odpovídá pouze jediná variace s opakováním. Příklad: Nechť rn je počet předem označených prvků v základním souboru rozsahu n. Nechť rozsah k výběrového souboru je pevný a předpokládejme, že lim— = j. Dokažte, že limP(c2)= p(c1 ) při označení n Řešení: r limP(C2 )= lim VA 0V n - rn k - X n lim x!(rn -x) (k -x)(n -rn -k + x} = k! (n - k) f k 1 limrn (rn -1)- ... '(rn - x + Ofr - rn )(n - rn -1)- ... '(n - rn - k + x + 0. Vx 0n®¥ n (n -1)- ...-(n - k +1) k k lim n ->°° 5l - 1 V n n 0 V n x-1 1 - ± V rn+1 n0V n0V f1 - i - k - x -1' 1 -- V n0 V 1- n0 k-1 Vn n0 n0 jx (1 - j)-x = P (c1 ) 153 r Příklad Příklad: Předpokládáme, že rozsah k výběrového souboru je pevný. Vypočtěte limity pravděpodobností jevů a1,b1,a2,b2 z příkladů 3.10. a 3.11. pro n ->«. Řešení: limP(A1 )= limn (n ~1)— (n ~ k +1) = 1, limP(A2 )= lim1 = 1 lim P (B1 )= lim 1 - n v n y = 1 -1 = 0, limP(B2 )= limk = 0 n-—00 n-—00 n Závěr plynoucí z příkladů 3.14. a 3.15.: Pokud je rozsah výběrového souboru konstantní a rozsah základního souboru roste nade všechny meze, stírá se rozdíl mezi výběrovým souborem s vracením a bez vracení. 154 Stochasticky nezávislé jevy Motivace: Při provádění pokusu se může stát, že z informace o nastoupení či nenastoupení jednoho jevu jsme schopni odvodit, zda jiný jev nastoupí či nenastoupí, tzn., že platí jedna z inkluzí a c B,A c b,a c B,A c b. V takovém případě hovoříme o deterministicky závislých jevech. Jejich protipólem jsou jevy stochasticky nezávislé - informace o nastoupení či nenastoupení jednoho jevu nijak neovlivní šance, s nimiž očekáváme nastoupení jiného jevu. V popisné statistice jsme zavedli četnostní nezávislost dvou množin g1,g2 v daném výběrovém souboru pomocí multiplikativního vztahu: p(G1 n g2) = p(G1 )p(G2). V počtu pravděpodobnosti požadujeme pro stochasticky nezávislé jevy a1,a2 splnění multiplikativního vztahu: p(a1 n a2 ) = p(a1 )p (a2 ). Pro tři jevy budeme požadovat, aby i jevy a1 n a2 a a3 byly stochasticky nezávislé, což vede ke vztahu p(a1 n a2 n a3 ) = p(a1 )p(a2 )p(a3 ). Tak můžeme pokračovat pro libovolný počet jevů. Definice: Nechť (Q, A, P) je pravděpodobnostní prostor. Řekneme, že jevy A, B e A jsou stochasticky nezávislé (vzhledem k P), jestliže P(A n B) = P(A) P(B). 155 Stochasticky nezávislé jevy Věta: Pro libovolné jevy A, B e A platí: a) 0 a A jsou stochasticky nezávislé jevy. b) H a A jsou stochasticky nezávislé jevy. c) Jsou-li A, B stochasticky nezávislé jevy, pak jsou stochasticky nezávislé též jevy A,b a a,B a a,b. Důkaz: ad a) p(0 n a) = p(0)p(a): 0 = 0 • p(a)=0 ad b) p(q n a)=p(q)p(a): p(a) = 1 • p(a) = p(a) ad c) P (A n B) = P(B - (A n B)) = P(b) - P(A n B) = P(b) - P(A )p(b) = P(b)[1 - P(A)] = P (A )p(b) Tvrzení pro jevy a, B se dokáže analogicky. p (a n b)= p(a u b )= 1 - p(a u b) = 1 - [p(A )+P(b)- p(a n b)] = 1 - p (a)- P(b)+p(a )p(B ) = 1 - p(a)- P(b)[1 - p(a)] = = [1 - p (a - p(b)] = p (X )p (b) 156 Stochasticky nezávislé jevy Definice: Nechť (ŕ, A , P) je pravděpodobnostní prostor. Jevy A1? An g A jsou stochasticky nezávislé (vzhledem k P), jestliže platí systém multiplikativních vztahů: . < j < n: P(Ai n Aj) = P(Ai) P(Aj) (dvojmístný multiplikativní vztah) "1 < i < j < k < n: P(Ai n Aj n Ak) = P(Ai) P(Aj) P(Ak) (trojmístný multiplikativní vztah) P(A 1 n ... n An) = P(A1) ... P(An) (n-místný multiplikativní vztah) Jevy A1s A2, ... g A jsou stochasticky nezávislé (vzhledem k P), jestliže pro všechna přirozená n jsou stochasticky nezávislé jevy A1? An g A . Příklad: V osudí jsou 4 lístky s číslicemi 000, 011, 110 a 101. Označme Ai jev, že na náhodně vytaženém lístku je 1 na i-tém místě. Zjistěte, zda jevy A1, A2, A3 jsou stochasticky nezávislé. Řešení: p(a1 ) = 2, p(a2 ) = -2, p(a3) = 2, p(a1 n a2 ) = 4, p(a1 n a3 ) = 4, p(a2 n a3) = 4. Vidíme, že dvoumístné multiplikativní vztahy jsou splněny, avšak trojmístný vztah nikoli, neboť p(a1 p(a1 )p(a2 )p(a3 ) = Jevy A1, A2, A3 nejsou stochasticky nezávislé. 157 Příklad Ukázka příkladu, kdy jsou jevy po dvou nezávislé, ale jsou celkově závislé. Uvazujme náhodný pokus „hod dvěmi mincemi", kdy sledujeme zda na mincích padl lfc (L) nebo (R). Množina všech možných výsledků (elementárních jevů) je tedy SI = [LL, LR, RL, RR] a všechny elementární jevy jsou stejně pravděpodobné, tj. maj f pravděpodobnost —. Najděte pravděpodobnost a zjistěte zda jsou nezávislé a po dvou nezávislé jevy (a) A1 na první mince padne líc; (b) A% na druhé minci padne líc; (c) A% na obou mincích padne totéž. Řešení: Q = {uucj2jw3,w4}, P(wí) = 1/4 Aľ = V(At) = 1/2 A2 = M,u3}, V(A2) = 1/2 ^ = {^1,^}, V(Az) = i;2 jevy j4i a A% jsou nezávislé, protože A^ n A2 = {^1} a 'P(.41n.42) = l/4=l/2-l/2 jevy j4i a .43 jsou nezávislé, protože .4 i h .43 = {^'1} a 'P(.41n.43) = l/4=l/2-l/2 jevy A2 a .43 jsou nezávislé, protože A% n .43 = {^'1} a n 40 = 1/4 = 1/2 ■ 1/2 jevy j4i,j42 a A% jsou závislé, protože Tli n j42 n A3 = {wi} a nAsn4,) = 1/4 ^ 1/2 ■ 1/2 ■ 1/2 158 Příklad Mohou být neslučitelné (disjunktní) jevy A a B nezávislé? Řešení: 0 = P(0) = P(AflB) = P(A)P(B) tedy disjunktníjevy mohou být nezávislé, jen když alespoň jeden z nich mánulovou pravděpodobnost. 159 Stochasticky nezávisléjevy Příklad: Zjistěte, zda existuje jev, který je stochasticky nezávislý sám se sebou. Rešení: p(a n a) = p(a)p(a), tedy p(a) = p(a)2. To je možné jen tak, že p(a) = 0 nebo p(a) = 1. Věta: a) Jestliže z třídy n stochasticky nezávislých jevů vybereme libovolnou podtřídu r jevů (2 < r < n), dostaneme opět třídu stochasticky nezávislých jevů. b) Stochastická nezávislost se neporuší, jestliže některé (nebo i všechny) jevy nahradíme jevy opačnými. c) Jestliže z třídy n stochasticky nezávislých jevů vybereme r disjunktních podtříd jevů (2 < r < n) a členy těchto podtříd libovolně sjednotíme nebo pronikneme, pak vzniklá sjednocení a průniky jsou opět stochasticky nezávislé jevy. d) Neslučitelné jevy nemohou být stochasticky nezávislé (pokud nemají všechny nulovou pravděpodobnost). e) Nemožný jev je stochasticky nezávislý s každým jevem. f) Jistý jev je stochasticky nezávislý s každým jevem. 160 Příklad Příklad: Firma investovala do tří nezávislých projektů. Pravděpodobnost zisku ztěchto projektů je 0,4, 0,5 a 0,7. Jaká je pravděpodobnost, že firma bude mít zisk a) právě jedenkrát (jev A) b) alespoň jedenkrát (jev B) c) právě dvakrát (jev C) Řešení: d) aspoň dvakrát (jev D) Označme Ai jev, že firma bude mít zisk z i-tého projektu, i = 1, 2, 3. e) ze všech tří projektů (jev E) ad a) _ _ _ _ _ _ f) ze žádného projektu? (jev F) p(a)= p(aj • p(a2) • p(a3) + p(a1) • p(a2) • p(a3) + p(a1) • p(a2) • p(a3) = = 0,4 • 0,5 • 0,3 + 0,6 • 0,5 • 0,3 + 0,6 • 0,5 • 0,7 = 10-3 (60 + 90 + 210)= 0,36 ad b)___ p(b)= 1-p(a1 na2 na3) =1-p(a1) p(a2 )p(a3 )= 1 - 0,6 • 0,5 • 0,3 = 1 - 0,09 = 0,91 ad c) p (c )= p(a1) ^ p(a2) ^ p(a3) + p(a1) ^ p(a2) ^ p(a3) + p(a1) ^ p(a2) ^ p(a3) = = 0,4 • 0,5 • 0,3 + 0,4 • 0,5 • 0,7 + 0,6 • 0,5 • 0,7 = 10-3 (60 +140 + 210)= 0,41 ad d) p (d )= p(c)+ p(a1 n a2 n a3 )= p(c )+ p(a1) • p(a2) • p(a3) = 0,41 + 0,4 • 0,5 • 0,7 = = 0,41 + 0,14 = 0,55 ad e) p (e )= p(a1 n a2 n a3 )= p(a1) • p(a2) • p(a3) = 0,4 • 0,5 • 0,7 = 0,14 ad f) p (f)= p a n a2 n a3 )= p a) p (aľ) p a )= 0,6 • 0,5 • 0,3 = 0,09 161 , 5. Podmíněná pravděpodobnost. J| Geometrická pravděpodobnost. Podmíněná pravděpodobnost.: Motivace: Opakovaně nezávisle provádíme týž náhodný pokus a sledujeme nastoupení jevu A v těch pokusech, v nichž nastoupil jev H. Podmíněnou relativní četnost A za podmínky H jsme v popisné statistice zavedli vztahem p(A/H) = p(iA(H)H). Tato podmíněná relativní četnost se s rostoucím počtem pokusů ustaluje kolem konstanty P(A/H), kterou považujeme za podmíněnou pravděpodobnost jevu A za podmínky H. Definice: Nechť (ŕ, A , P) je pravděpodobnostní prostor, H e A . jev s nenulovou pravděpodobností. Podmíněnou pravděpodobností za podmínky H rozumíme funkci P(./H): A — R danou vzorcem: " A e A : P(A/H) P(A n H) P(H)" 162 Podmíněná pravděpodobnost Věta: Podmíněná pravděpodobnostje pravděpodobnost ve smyslu axiomatické definice a kromě toho pro ni platí: a) P(A1 n A2) = P(A0 P(A2/A0 pro P(A1) * 0. b) P(A1 n A2) = P(A2) P(A1/A2) pro P(A2) * 0. c) Jevy A1? A2 jsou stochasticky nezávislé, právě když P(A1/A2) = P(A1) nebo P(A2) = 0 a právě když P(A2/A1) = P(A2) nebo P(A0 = 0. Důkaz: Stačí ověřit platnost axiómů P2, P10, P15. ad a), ad b) Plyne přímo zdefiničního vzorce. ad c) NechťA1, A2 jsou stochasticky nezávislé => p(A1 /A2)= P(p(n^2) = 2) = p(v ). Nechť naopak P(A1/A2) = P(A1). Z definice: p(A1 / A2)= P2)=p(A1 )=> p(A1 n A2)= p(A1 )p(A2), tedy A1, A2 jsou stochasticky nezávislé. 163 Příklad Příklad: Jakáje pravděpodobnost, že při hodu kostkou padlo sudé číslo, je-li známo, že padlo číslo menší než 5? Řešení: w = {ol,...,©6}, A ... padlo sudé číslo, a = {q2,w4,w6}, H ... padlo číslo menší než 5, h = {b1,w2,w3,w4}, A n H = {o2,co4} P (a/h )= P(A(n)i)=I = I P(H) 4 2 6 Příklad: Dvakrát hodíme kostkou. Jakáje pravděpodobnost, že součetpřesáhne 10, víme-li, že padla (aspoň jedna) šestka? Řešení: |{[6,5],[5,6],[6,6]}| 6 - 6 164 Věta o násobení pravděpodobností Věta: (Věta o násobení pravděpodobností) Nechť (Q, A , P) je pravděpodobnostní prostor, A1? A2, An takové jevy, že P(A1 n ... n An-1) * 0. Pak P(A1 n A2 n ... n An) = P(A1) P(A2/A1) P(A3/A1 n A2) ... P(An/A1 n ... n An-1). Důkaz: Matematickou indukcí. Předpokládáme, že vztah platí pro libovolné přirozené n > 2 a dokážeme jeho platnost pro n+1: í n P(A, n ... n An n An+1 )= n A n+1 n = P 0 V i=1 0 I Ai PAn+1/1 Ai = P(A1 )P(A2/A1 )... P(An+1/A1 n ... n An) i=10 Příklad: Ze skupiny 100 výrobků, která obsahuje 10 zmetků, vybereme náhodně bez vracení 3 výrobky. Vypočtěte pravděpodobnost jevu, že první dva výrobky budou kvalitní a třetí bude zmetek. Řešení: Jev Ai znamená, že i-tý vybraný výrobek je kvalitní, i = 1, 2, 3. Počítáme P(A1 n A2 n A7) = P(A0 P(A2/A0 P(AJ/A1 n A2) = = 0,083. 100 99 98 165 Věta o úplné pravděpodobnosti, Bayesův vzorec Věta (vzorec pro výpočet úplné pravděpodobnosti a Bayesův vzorec) Nechť (ŕ,A ,P) je pravděpodobnostní prostor, Hi e A , i e I (I je nejvýše spočetná indexová množina) takové jevy, že P(Hi) > 0, U H = ŕŕ, Hi n H = 0 pro i ^ j (říkáme, že jevy Hi, i e Itvoří úplný systém hypotéz). iel a) Pro libovolný jev A e A platí vzorec úplné pravděpodobnosti: P(A) = S P(Hi)P(A/Hi) iel b)Pro libovolnou hypotézu Hk, k e Ia jev Ae A s nenulovou pravděpodobnostíplatíBayesůvvzorec: P(Hk/A) = P(Hk)P(A/Hk) P(A) (P(Hk/A) se nazýváaposteriornípravděpodobnost hypotézy Hk, P(Hk) je apriornípravděpodobnost.) Důkaz: ad a) Jev A vyjádříme jako sjednocení neslučitelných jevů: a = (a n hí). Pak p(a)= p(jj (A n h, )j = Xp(a n h, )= £p(h, >(a/ h,) ad b) p(Hk/A)= P(Hk)P(A/Hk) J P(A) P(A) Ilustrace vzorce pro úplnou pravděpodobnost 166 Příklad 1) Bez vracení taháme z urny s a černými a b bílými koulemi. Jaká je pravděpodobnost, že ve druhém tahu vytáhneme černou kouli, jestliže v prvním tahu jsme vytáhli kouli bílou? Řešení: b a a + b a + b -1 a b ^ a + b -1 a + b -1 a + b a + b -1 2) V dostihu zvítězíkůň A (B) s pravděpodobností 0,5 (0,3). Kůň A ztratil na startu příliš a je jisté, že nezvítězí. Jakáje nyní pravděpodobnost, že zvítězí B? Řešení: P(A | H) - P(ArlH)- 03 - 0,6 P (H) 1 - P (H) 0,5 167 Příklad V první urně je 6 bílých a 2 černé koule, ve druhé jsou 4 bílé a 2 černé koule. Náhodně zvolíme urnu a vytáhneme jednu kouli. Jaká je pravděpodobnost, že bude bílá? Rešení: Pravděpodobnost tahu z první (resp. druhé) urny, je 1/2. Označíme-li B =[tah bílé koule], Ui = [tah z urny i], je podle věty o celkové pravděpodobnosti P (B ) = P (B | Ui) ■ P (U i) + P (B | U 2) ■ P (U 2) = ■ i + ■ 2 = ^ = 0,708 6 + 2 2 4 + 2 2 24 168 Příklad Automat X vyrobí za směnu dvakrát více výrobku než automat Y. Pravděpodobnost vzniku zmetku je u automatu X 0,02, u Y 0,05. Po skončení směny se výrobky ukládajído jednébedny. Jakáje pravděpodobnost, že výrobek náhodně vybraný z této bedny nenízmetek? Řešení: Podle věty o celkovépravděpodobnosti (poměr výrobků v bedně je 2 : 1 ve prospěch automatu X, tj. 2/3 výrobků pocházíod X a 1/3 od Y) 2 1 2 91 P(A) = - - 0,98 + - - 0,95 = -2— = 0,97 3 3 3 169 Příklad Mezi 20 střelci jsou 4 výborní, 10 dobrých a 6 průměrných s pravděpodobnostmi zásahu 0,9, 0,7 a 0,5. Jaká je pravděpodobnost, že dva náhodně vybraní střelci oba zasáhnou cíl? Rešení: Podle toho, kterádvojice bude vybrána 4•3 4•10 10•9 P (A) = (0,9 • 0,9)--+ (0,9 • 0,7)--+ k + (0,5 • 0,5)--= 0,46 20 • 19 20 • 19 20 • 19 170 Věta o úplnépravděpodobnosti, Bayesův vzorec Thomas Bayes (1702 - 1761): Presbytariánský duchovní Poznámka (Návod na použití vzorce pro výpočet úplné pravděpodobnosti a Bayesova vzorce) Nejprve podle textu úlohy stanovíme úplný systém hypotéz, tj,. jevy, které se navzájem vylučují a přitom vyčerpávají všechny možnosti. Vúlohách vedoucích na vzorec pro výpočetúplnépravděpodobnosti se zajímáme o pravděpodobnost jevu, který s hypotézami nesouvisí, zatímco v úlohách vedoucích na Bayesův vzorec nás zajímá pravděpodobnost některéhypotézy za podmínky, že nastal jev, který shypotézami nesouvisí. 171 Příklad ■ Příklad: Test obsahuje 100 otázek. Zkoušený si nejprve vylosuje otázku a pak si jeho postup zjednodušeně představíme takto: zná.li správnou odpověď, zatrhne ji. Nezná-li správnou odpověď, zvolí se stejnou pravděpodobností kteroukoliv ze čtyř možných odpovědí. Předpokládejme, že ve skutečnosti zná zkoušený právě k správných odpovědí. a) S jakou pravděpodobností správně odpoví? b) S jakou pravděpodobností je při správné odpovědi pravdivé tvrzení, že zkoušený ve skutečnosti jenom hádal? Řešení: H1 ... zkoušený zná správnou odpověď, H2 ... zkoušený nezná správnou odpověď, A ... zkoušený správně odpoví P(Hi ) = —,Pfei ) = 100-k ,P(A/Hi )= 1,P(A/H2 ) = - ad a) P(A) = P(H1 )P(A/H1)+P(H2 )P(A/H2 ) = -L. 1 +100-k. i _ 3k±l°° ad b) p(h2/a )= P(H2 )P(A/H2)_ 100 p(a ) 100 - k 1 _4 _ 100 - k 3k +100 _ 3k +100 400 k 0 10 50 90 P(A) 0,25 0,325 0,625 0,925 P(H2/A) 1 0,692 0,2 0,027 172 CL 1,1 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 Příklad p (a ) 3k +100 400 Závislost P(A) na k -20020406080100120 k (P 1,2 1,0 0,8 0,6 0,4 0,2 0,0 -0,2 P (h2/a ) = 2 3k+100 Závislost P(Hk/A) na k ■ ■ ■ ■ 1 ■ i i i 1 ■ ■ i i \ \ • —L _._._._._1_._._._._1_._._._._1_._._._._ -20020406080100120 k 173 Příklad Příklad: K osevu byly vybrány dvě odrůdy pšenice, a to 20% první odrůdy a 80% druhé odrůdy. Pravděpodobnost, že ze zrna vyroste klas, je pro první odrůdu 0,95 a pro druhou odrůdu 0,98. Jaká je pravděpodobnost, že a) z náhodně vybraného zrna vyroste klas? b) náhodně vybrané zrno, z něhož vyrostl klas, pocházelo z první odrůdy pšenice? c) náhodně vybrané zrno, z něhož vyrostl klas, pocházelo z druhé odrůdy pšenice? d) náhodně vybrané zrno, z něhož nevyrostl klas, pocházelo z první odrůdy pšenice? e) náhodně vybrané zrno, z něhož nevyrostl klas, pocházelo z druhé odrůdy pšenice? Řešení: Jev A ... z náhodně vybraného zrna vyroste klas Jev Hi ... zrno pochází z první odrůdy pšenice Jev H2 ... zrno pochází z druhé odrůdy pšenice p(h1 ) = 0,2, p(a|hi)= 0,95, p(h2) = 0,8, p(a|H2)= 0,98 ad a) p(a) = p(h1 )p(a/h1)+ p(h2 )p(a/h2) = 0,2 • 0,95 + 0,8 • 0,98 = 0,19 + 0,784 = 0,974 ad b) p(H1/a)=p(h^ 0,2 • 0,95 p(a) ~ 0,974 p(h2 )p(a/h2 )= 0,8 • 0,98 0,1951 ad c) P(H2 / A) = ^^±^i = ^1^1 = 0,8049 ' v 2 ' p(a) 0,974 ad d) p(h1/a)= p(h1 ffi"1 ) = M:005 = -001- = 0,3846 ad e) p (h2/a )= p(h2 )pLA,/h2) 1 - 0,974 0,026 = 0,016 = 0,6154 174 1 - 0,974 0,026 Příklad 1) Jeden ze 3 střelců s pravděpodobnostmi zásahu 0,3, 0,5, 0,8 vystřelil a zasáhl. Jaká je pravděpodobnost, že střílel druhý střelec? Řešení: 0,5' 3 5 P (A)=—1-3-r==0,3125 0,3 •- + 0,5 •- + 0,8 — 10 333 2) Mezi 20 střelci je 5 výborných, 9 dobrých a 6 průměrných s pravděpodobnostmi zásahu 0,9, 0,8 a 0,7. Náhodně vybraný střelec ze 2 ran trefil jednou. Jaká je pravděpodobnost, že šlo o výborného (dobrého, průměrného) střelce? Řešení: 2 • 0,9 • 0,1 • 5 P (byl to výborný) =-5-20-— = 0,143 2 • 0,9 • 0,1--+ 2 • 0,8 • 0,2--+ 2 • 0,7 • 0,3 • 20 20 20 P(byl to dobrý) = 0,457 P (byl to průměrný) = 0,4 175 Příklad Víme-li, že pravděpodobnost odhalení AIDS při testu je 0,999, že pravděpodobnost správného otestování zdravého jedince je 0,99 a že AIDS se vyskytuje u 0,006 lidí, jakáje pravděpodobnost, že člověk, u kterého byl test pozitivní, AIDS skutečně má? Řešení: Označírne-li A = [má AIDS], T = [test říká AIDS], známe P(T |A) = 0, 999, P (T | A) = 0,99, P(A) = 0, 006. Bayesovavěta nám dá P (A | T) P(T | A)P(A) P (T | A) P (A) + P (T | A) P (A) 0,999 • 0,006 0,376 0,999 • 0,006 + (1 - 0,99) • (1 - 0,006) 176 Geometrická pravděpodobnost ■ Motivace: Vněkterých situacích je vhodné zvolit za základní prostor nikoliv obecnou množinu w , ale n-rozměrný prostor Rn a za možné výsledky reálné vektory (x1,...,xn). Za jevové pole však nevezmeme systém všech podmnožin prostoru Rn (ten totiž obsahuje i tzv. neměřitelné množiny), ale méně podrobné borelovské pole Bn. Émile Borel (1871 - 1956) - francouzský matematika politik. Zabýval se teorií míry, teorií pravděpodobnosti A teorií her. Byl poslancem francouzského parlamentu a ministrem námořnictva. Na borelovském poli pak speciálním způsobem zavedeme geometrickou pravděpodobnost a dostaneme pravděpodobnostní prostor (Rn, Bn, Q). 177 Borelovské pole, Borelovské množiny Definice Nechť n je přirozené Číslo. Množinu Rn — (—oc,oc) x ... x (-oc,oc) = (—oo, oc)" nazýváme /í-rozměniým prostorem. Minimální jevové pole na i?" pro (xi7... xn) 6 Rn nazýváme n-rozmerný r n borelovskýni polem Bn a prvky tohoto pole nazýváme (n-rozmernými) horelovskými množinami. Dvojice (/?",£?") je tedy měřitelný prostor. (Není podstatné, že borelovské pole je generováno právě intervaly typu (-«, ^) x ... x(-w, x„). Mohlo by být generováno i jinými typy intervalů.) Věta: Borelovské pole je jevové pole, tzn., že splňuje axiómy J2, J6, J8. Věta: Mezi borelovské množiny náleží zejména prázdná množina, celý základní prostor, všechny jednobodové, konečné a spočetné množiny, intervaly všech typů, všechny uzavřené a otevřené oblasti a všechna konečná a spočetná sjednocení a průniky těchto množin. Rovněž kartézský součin borelovských množin je borelovská množina, ovšem vyšší dimenze. 178 Borelovskyměřitelná zobrazení, Borelovské funkce Definice Nechť (íí, A), (i?", Bn) jsou měřitelné prostory. Zobrazení X : íl h-> Rn se nazývá borelovsky měřitelné (vzhledem k A), právě když úplný vzor každé n-rozměrné borelovské množiny je jev, tj. VB £ B" : X'n,(B) = {u; e~Ú;X(u) ě B} € A. Ve speciálním případě, kdy = Rm a A = Bm. X = g = (<7i, - - ■ , r/r<), tj. {(si,...,a?m) G iP";(fll(*i,--- >«m)>---itf»(«if- - - j*™)) € £} € Bm, hovoříme o borelovské funkci. Věta: Mezi borelovské funkce náleží zejména všechny spojité a po částech spojité funkce. Rovněž limita všude konvergentní posloupnosti borelovských funkcí je borelovská funkce. Definice: Nechť (Rr\Bn) je měřitelný prostor a G € Bn je borelovská množina. Objemem borelovské množiny G rozumíme číslo mes(G) = j ... / (Iry .. .dxni pokud Riemannův integrál vpravo existuje. q G Geometrická pravděpodobnost Definice: Nechť objem mes(G) borelovské množiny G je nenulový a konečný. Geometrickou pravděpodobností soustředěnou na množině G rozumíme funkci Q : Bn h+ R danou vmiĽmii. VB e B'\ B C G , pokud itiťs(B) existuje. Věta: Geometrická pravděpodobnost je pravděpodobnost ve smyslu axiomatické definice, tj. splňuje axiómy P2, P10, P15. Trojice (Rn, Bn, Q) je tedy pravděpodobnostní prostor. 180 Příklad Příklad: Na úsečce AB délky d jsou náhodně zvoleny body X a Y, přičemž vzdálenost bodu X od bodu A je menší než vzdálenost bodu Y od bodu A. Jakáje pravděpodobnost, že délkaúsečky AX je větší neždélka úsečky XY? Řešení: G = {(x, y)e R2 ;0 < x < d,0 < y < d,x < y} B = {(x, y)e G;x > y - x} x y y d A XY B mes1 mes d 2 •d 4.q(B)=mes^=2 mes G 2 4 mes(G) 2 Délka úsečky AX je větší než délka úsečky XY s pravděpodobností 0,5. 181 Příklad Dívka a chlapec si smluvili schůzku mezi 12:00 a 13:00. Přijdou náhodně v tomto rozmezí a čekají na sebe 20 minut, nejdéle však do 13:00. Jaká je pravděpodobnost, že se setkají? Řešení: 13:00 12:20 12:00 mes (G) = 1 mes ( B) = — 9 L) G(B) 5 9 182 Příklad Volíme náhodně dvěčísla z intervalu (0,1). Jakáje pravděpodobnost, že jejich součet je menšínežjedna a současně jejich součin menšínež0,09? 183 Příklad Buffonova úloha. V rovině jsou rozmístěny rovnoběžky ve vzdálenosti d > 0. Na rovinu hodíme náhodně jehlu délky 0 < l < d. Jaká je pravděpodobnost, že jehla protne některou rovnoběžku? Řešení Předpokládejme, že náhodně znamená, že každápoloha (středu) a každáorientace jehly je stejně pravděpodobná a že tyto dvě nahodile proměnné jsou na sobě nezávislé. Nechť x je vzdálenost středu jehly od nejbližší rovnoběžky a 9 je úhel, který jehla svírá s rovnoběžkami. 01 sin jdj mes (Q) nd -L nd 184 6. Statistický software. Vizualizace dat. 185 Software AcaStat GAUSS MRDCL ADaMSoft GAUSS NCSS Analyse-it GenStat OpenEpi ASReml Golden Helix Origin Ox programming Auguri gretl language BioStat JMP OxMetrics BrightStat MacAnova Origin Dataplot Mathematica Partek EasyReg Matlab Primer Epi Info MedCalc PSPP EViews modelQED R Excel Minitab R Commander^] RATS StatsDirect RKWardr4] Statistix SalStat SYSTAT The SAS Unscrambler SOCR UNISTAT Stata VisualStat Statgraphics Winpepi STATISTICA WinSPC StatIt XLStat StatPlus XploRe SPlus SPSS 186 Data miningový software > IBM's Intelligent Miner, J' (PASW Modeler) > SGI's MineSet, > SAS's Enterprise Miner. □ Rada vestavěných produktů: > fraud detection: > electronic commerce applications, > health care, > customer relationship management □ □ Cca 20 až30 dodavatelů Hlavní hráči na trhu: > Clementine, IBM SPSS Modeler 187 Software - SAS □ §sas : www.sas.com 188 □ Společnost SAS Institute > Vznik 1976 v univerzitním prostředí > Dnes: největší soukromá softwarová společnost na světě (více než 11.000 zaměstnanců) > přes 45.000 instalací > cca 9 milionů uživatelů ve 118 zemích > v USA okolo 1.000 akademických zákazníků (SAS používávětšina vyšších a vysokých škol a výzkumných pracovišť) 189 SAS 19G SAS Podpora studentů Možnost rozšířeni licence na domácí instalace pro studenty SAS Fellowship Program -software zdarma pro diplomku či dizertaci Zadávání a vedení diplomových prací Sdílení informací, zkušeností či příkladů v uživatelských skupinách Interaktivní moduly nebo programovací prostředí Statistická analýza Matice Časové řady Operační výzkum Kontrola kvality 191 SAS □ Statistická analýza: > Popisná statistika > Analýza kontingenčních (frekvenčních) tabulek > Regresní, korelační, kovarianční analýza > Logistická regrese > Analýza rozptylu > Testování hypotéz > Diskriminační analýza > Shluková analýza > Analýza přežití > ... •rr+ WWWW -»¥1 :_ -ar ■m—n ■-0—Pt-"*—<1 -Id- ^ z - ^ . . .. —— 192 SAS □ Analýza časových řad: > Regresní modely > Modely se sezónními faktory > Autoregresní modely > ARIMA > Metody exponenciálního vyrovnání > ... 193 □ více o SASu: http://www.sas.com/offices/europe/czech/ □ (neúplný) seznam komerčních společností využívající SAS: http://www.sas.com/offices/europe/czech/reference/list.html □ o akademickém programu: http://www. sas. com/offices/europe/czech/academic/index.html □ o konferenci SAS forum: http://www.sas.com/reg/offer/cz/2010_sas_forum_2010 194 Software -SPSS □ : www.spss.cz 1 : prvnijjredpis 01-JAN-1900 00:00:00 date_ratif pmijredpis goodz_60 podvod VBk JcL.Oin. dobaZamD TdobaZamY var var var var var var 16-JUN-2G00 01-JAN 1300 0 0 24.200 .47B 16-DEC-1999 01-JAN 1300 0 0 25.263 .000 3 6-JUN-2G00 03-AUG 2000 59.164 .478 6-JUN-2G00 16-JUL 2000 50.216 2.140 781 197 5 6-JUN-2G00 15-JUL 2000 28.447 3.45B 1262 303 B B-JUN-20DD 17-JUL 2DD0 22 304 2614 354 237 6-JUN-2G00 7-JUN-2G00 g 5-SEP 2G00 ÖHSRl^S □ 1 fe 1 [? 1 ©> 3| -r- «3ph I IHllUr- Ind.». HkIP 10 25-SEP 2G00 7= I !l 25-SEP 2G00 II II 1 1 * 1 <31 5 2 25-SEP 2G00 3 25-SEP 2000 - 3 0*oUc Regressen ■ 6-DEC V.iii.iMssinthe Ediiaition 5 6-DEC 93 B S.E. Wald df Sig. Exp(B) 33 SSep dobaZamY .i \ ::: "I 18 6-DEC 19 □ Variables in the Equation 6-DEC 20 5-SEP 2000 ♦ Graph 5-SEP 2G00 5-SEP 2G00 - -g Block 1: Method = Erter ü'r", 23 5-SEP 2G00 25 5-SEP 2G00 □ Model Summary □ Classify™ Table □ Variables in the Equation -ES] Graph Title 26 2G00 1 -0 000- i 1 2000 2G00 2G00 11 0 Notes 30 2G00 32 6-JUN-2G00 33 6-JUN-2G00 34 6-JUN-2G00 35 6-JUN-2G00 36 6-JUN-2G00 37 6-JUN-2G00 33 25-SEP-2G00 40 25-SEP-2G00 25-SEP-2G00 25-SEP-2G00 I m 16-DEC-1999 TSP5S Proctor iS rea Ii I j I I OI-JAN-ISDOI^^^^O^ 2B.B74| | | DDd| | ( | HI 195 SPSS □ IBM SPSS/ PASW Modeler 13 (dříve Clementine) http://www.spss.cz/ibmspss modeler.htm □ více o IBM SPSS Modeler 13 (dříve Clementine): http://www.spss.cz/ibmspss_modeler.htm □ (neúplný) seznam zákazníků: http://www.spss.cz/zakaznici.htm □ akademický program: http://www.spss.com/academic/ 197 198 Statistica □ více o Statistica Data Miner: http://www.statistica.cz/produkty/5-dataminingove-nastroje/21 -statistica-data-miner/detail/ □ (neúplný) seznam zákazníků: http://www.statsoft.com/customers/ □ akademický program: http://www.statsoft.com/academic/ □ Petra Beranová - stručný manuál k ovládání programu STATISTICA: http://www.statsoft.cz/download/soubory/STATISTICA_manual.pdf 199 Software □ MS Excel: http://office.microsoft.com/en-us/excel/default.aspx in __ j]n. i in n ; llllllll ill Hill ilill | Ř _ _ _ ZI --nr— 1 Věková struktura podnikajících cizinců 4% 38% 48% ] -19 □ 20-24 □ 25-39 □ 40-54 □ 55-59 □ 60-64 □ 65+ See what's new ► http://office.mlcrosoft.com/en-us/excel/HA100738731033.aspx 200 Software a MS Excel: Počet z id BAD score k ,QQ 1,QQ Celkový součet good bad all BR WOE 77221 9,42% 23,22% 13,06% 0,721263 9,42% 23,22% 13,06% 46,88% -0,392 ,73 5,43% 11,15% 6,94% 0,727551 5,43% 11,15% 6,94% 42,35% -0,312 ,73 9,98% 11,15% 10,29% 0,732201 9,98% 11,15% 10,29% 28,57% -0,048 ,73 19,51% 20,74% 19,84% 0,734083 19,51% 20,74% 19,84% 27,57% -0,027 ,74 10,31% 9,29% 10,04% 0,735168 10,31% 9,29% 10,04% 24,39% 0,045 ,7411,31%6,50%10,04%0,73563211,31%6,50%10,04%17,07%0,240 ,7411,09%7,12%10,04%0,73670611,09%7,12%10,04%18,70%0,192 ,7410,75%7,43%9,88%0,73975310,75%7,43%9,88%19,83%0,161 _, 74 12, 20% 3,41%_9,88% 0, 742267 12, 20% 3,41% 9,88% 9,09% 0,554 Celkový součet 100, 00% 100, 00%_100, 00% 25,00% 20,00% 15,00% 10,00% 5,00% 0,00% 80,00% 60,00% 40,00% 20,00% 0,00% -20,00% -40,00% "4 -60,00% 0,72130,72760,73220,73410,73520,73560,73670,73980,7423 i-1 good i-1 had i-1 a!! RR WOF 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Lorenzova i\nvi\a Lift 2,0 1 1,5 1,0 0,5 0,0 0 0,2 0,4 0,6 0,8 1 0,720,730,730,730,740,740,740,740,74 score 2G1 Software □ Matlab^: www.mathworks.com, www.humusoft.cz 202 □ Software Matlab^: http://www.humusoft.cz/produkty/matlab/matlab/ 203 Software - MU https://inet.muni.cz/app/soft/licence Nabídka softwaru \ Aplikace je určená pro registraci softwaru a následne získání přístupu k instalačním klíčům a dalším informacím (popř. přístup k samotnému softwaru). Přihlášen/ uživatel si muže nechat zobrazit dostupný software podle zvolene kategorie a aktuálnosti. Po zvolení určitá kategorie se zobrazí tabulka dostupného softwaru. Po kliknutí na 'Popis' je v některých případech nutne při první návštěvě odsouhlasit licenční ujednání a následně zadat počet licencí (počet počítačů, na kterých bude software provozován). Po potvrzení již budou nabídnuty veškeré dostupné informace ke konkrétnímu softwaru. Zde je možné i nadále měnit počet licencí. Pokud je dostupný soubor s určitou instalační verzí, tak pro jeho stažení na disk stačí jen kliknout odkaz "Stáhnout" a pokračovat dle instrukcí internetového prohlížeče. Software Výběr kategorie softwaru: [Aplikace 0 Pouze aktuální software (platný) 0 Pouze volné licence Název softwaru Lokalizace Popis Platnost od Platnost do ▼ SPSS CR, spol. s r.o. Clementine 13 (PASW Modeler 13) EN - Anglická verze Akademická multilicence pro MU 2010 04.01.2010 31.01.2011 SPSS 18 (PASW Statistics 18) EN - Anglická verze Akademická multilicence pro MU 2009 09.12.2009 01.02.2011 ▼ StatSoft Statistica 9.0 CZ - Česká verze Jednouživatelská verze 09.12.2009 31.12.2010 Statistica 9.0 EN - Anglická verze Jednouživatelská verze 30.09.2009 31.12.2010 Statistica 9.1 EN - Anglická verze Jednouživatelská verze 10.03.2010 31.12.2010 □ Matlab 2009a: ÚVTMU http://www.muni.cz/ics/services/software Kontaktní e-mail scrt-iretĚic^.muni.cz Informace o serveru inet.muni.cz 2G4 GIGO □ Garbage in, Garbage out (smetí dovnitř, smetí ven) > sebelepší model/proces/software nevyrobí ze smetí nic jiného než opět smetí. 205 2G6 Vizualizace - zdroje □ Na prvním místě se obvykle citují knihy prof. Tufteho, např. Tufte E.R. (1983) The Visual Display of Quantitative Information, Graphic Press, Chesire, Conn. □ Weby o vizualizaci, např. > http://www.math.yorku.ca/SCS/Gallery/noframes.html - galerie s poučným výkladem a příklady i nezdařených či lživých grafů > http://www.agocg.ac.uk/ - John Lansdown (1992) Aspects of Design in Computer Graphics: Some Notes -http://www.agocg.ac.uk/train/hitch/hitch.htm □ Jiné weby, např. stránky různých vizualizačních programů a organizací > http://www.cybergeography.org/atlas/atlas.html nebo http ://miner3d.com/products/gallery.html 207 Vizualizace - historie □ William Playfair, 1786: první publikovaná prezentační grafika 208 Vizualizace - historie □ Dr. John Snow, 1845: epidemie cholery v Londýně 209 Vizualizace - historie □ Florence Nightingale, 1858: důvody úmrtí v průběhu Krymské války (1853-1856) 210 Vizualizace - historie □ Harry Beck, 1931: schéma Londýnského metra 211 Vizualizace -investigativni analyza a 1 2 http://www,J2inc,com/ Law Enforcement » Counterterrorism » Narcotics investigations » Organized crime » Intelligence analysis » Fraud » Missing persons » Major investigations » Counterfeiting » Immigration control » Major event security » Money laundering » Gang investigations Government » Criminal prosecutions » National security » Military intelligence » Embassy security » Postal inspection and fraud » Prison investigations » Park and wildlife services » Antitrust investigations » Tax fraud investigations » Customs investigations Commercial » Forensic accounting » Money laundering » Insider trading violations » Corporate security » Anti-pirating investigations » Entertainment copyright violations » Competitive intelligence » Civil lawsuits » Fraud: » Credit card » Insurance » Retail » Health care » Commercial » Telephone 212 Vizualizace -investigativní analýza □ osobní kontakty, pojistné podvody 213 Vizualizace -investigativní analýza □ Praní špinavých peněz, kriminální gangy 214 Vizualizace -portfolio management □ Hledání závislostí v datech: 215 Vizualizace - portfolio management □ Distribuční funkce doby do defaultu 216 Vizualizace - portfolio management □ Test stability scoringové funkce 217 Vizualizace - portfolio management □ Vizualizace kreditních rizikových nákladů (KRN) 218 Vizualizace - portfolio management □ Histogram, Distribuční funkce 219 7 Vizualizace - portfolio management □ Bodové grafy 220 Vizualizace - portfolio management □ Lorenzova krivka FGOOD 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 F Gini A A + B Gini = 2 A BAD 221 Vizualizace - dendrogram Credit ranking (1=default) Node 0 Category %n Bad 52,01 168 Good 47,99 155 Total (100,00) 323 T Paid Weekly/Monthly Adj. P-value=0,0000, Chi-square=179,6665, df=1 Weekly pay I Node 1 Category %n | P Bad 86,67 143 Good 13,33 22 Total (51,08)165 T I Monthly salary _I_ Node 2 Category %n | P Bad 15,82 251 Good 84,18 133 Total (48,92) 158 Social Class Adj. P-value=0,0004, Chi-square=20,3674, df=2 T Age Categorical Adj. P-value=0,0000, Chi-square=58,7255, df=1 Management; Professional 1 Node 3 Category %n | P Bad 71,11 32 □ Good 28,89 13 Total (13,93) 45 Clerical;Skilled Manual 1 Node 4 Category %n P Bad 97,56 80 □ Good 2,44 2 | Total (25,39) 82 Unskilled 1 Node 5 Category%n Bad81,5831 Good 18,42 7 | Total (11,76) 38 I- Young (< 25) 1 Node 6 Category %n | P Bad 48,98 241 Good 51,02 25 Total (15,17) 49 -1 Middle (25-35);Old ( > 35) 1 Node 7 Category %n □ Bad_0,92 1 P Good 99,08 1081 Total (33,75) 109 222 Vizualizace - ekonomie 223 Vizualizace - ekonomie 224 Vizualizace - ekonomie 225 Vizualizace v biologii/chemii □ 3D zobrazení proteinu 226 Molecular EtoctrMtaÚt Půleními Cubarhng ůf Snlvtnit-Atttsslblfr SurfocM ůf Phage Cro Repressor Protein Comparison ef Three Visualization Packages Meteo-vizualizace 227 Kartogram □ Obce s počtem 500 a více obyvatel s vysokorychlostním připojením k internetu, podle okresů (%), k 31.12.2006 228 Kartogram 229 Kartodiagram 23G další typy Geografická data 232 7. Náhodné veličiny Motivace: Výsledky náhodného pokusu lze popsat reálnými čísly (resp. reálnými vektory) pomocínějakého zobrazení x: W ® r ( X = (x1?...,Xn): W ® Rn). Pokud bude toto zobrazení splňovat určité podmínky, nazveme ho náhodnou veličinou. Příklady náhodných veličin: počet členů náhodně vybrané domácnosti, počet chyb, jichž se dopustínějaké zařízení za určitou dobu, doba do poruchy nějakého zařízení, hmotnost náhodně vybraného výrobku apod. Vztah mezi znakem a náhodnou veličinou Pojem „znak", který jsme zavedli v popisné statistice, je sice blízký pojmu „náhodná veličina", ale není s ním totožný. Znak může být považován za náhodnou veličinu, jestliže jeho hodnoty zjišťujeme na objektech, které byly vybrány ze základního souboru náhodně. Definice: Nectiť (íl, A)) í-fi", B™) jsou merit dne prostory- Zobrazení X ; Í3 Jí" se nazývá náhodná veličina (vzhledem k A), práve když je borelovsky mčritelné (vzhledem k A). Pro 71 = 1 hovoríme o skalární náhod Ti ŕ voličiitio. pro n > "2 o náhodném vektoru. Pritom zobrazení Xi ; íí —> R.....Xn = Í2 ■—> _f2 se nazývají složky tiáhoditióhť] vektoru. Obraz X(ů,') = (A^u,1),...^^^)) se nazývá číselná rtvilizfice náhodné veličiny X příslušná možnému výsledku oj. 233 Ilustrace náhodné veličiny Borelovská množina Příklad Příklad: Náhodný pokus spočívá v hodu kostkou. Základní prostor Q = fo,...,w6}. Uvážíme dvě jevová pole, a to A max= {a;A íQ} a A = {Q 0, fo, w3, w5} {o2, w4, w6}}. Zjistěte,zda zobrazení X: Q® r, kterépoloze kostky číslem i nahoru přiřazuje číslo i, i = 1, ..., 6, je náhodná veličina vzhledem k A max a vzhledem k A . Řešení: A % £ H h 6 Zobrazení x : q ® r je náhodná veličina vzhledem k Amax, protože úplný vzor každé borelovské množiny je jev vzhledem kAmax .Vzhledem k A však X nenínáhodnáveličina: Úplný vzor množiny (- °°,4)je {ww2 w3 w4} č A 235 Příklad Zavedeme zobrazení W -> R, které poloze kostky lichým číslem nahoru přiřazuje 0 a sudým 1. A = & 0, K W 3, W 5 } Í° 2, W4,W 6 )} Toto zobrazeníje náhodná veličina vzhledem k A a nazývá se ukazatel parity. 236 Náhodnáveličina Označení a! JestMíe íiobrozí neho/pučí nedorozumení, zapisujeme t^ííickLiiou veličinu i její číselnou realizaci týmž symbolom X. b) Množinu {d € UzX(ijj) £ R] zkrácení zapisujeme {X e B] a čteme: náhod t iá vel i Ítí n ;i X Tí kh I i ä >val a v 1 >< iľn "U >vskŕ 1111 k iž i n ŕ H. Ve spec iáh i í 111 i iŕí j i;t< lé, kdy i? = {x} resp. /? — ( cc,x), píšeme {X — x} resp. {X < x|, ľ) Zápis pravdepodobnosti zkrátíme taktu: F({uj f lí:X(uí) e #}) =P{X É B) P{{u € íl;X(w) € B]f{u € íl: Y(uO í= C}) = P(X e B/Y € ťľ). 237 Transformovaná náhodná veličina Nudiť {íl, A), {Rn,Bn), {Rm,Btfl)]sou rnuŕitulnú prostory. Nudiť X : í í R" ju náhodná vuliana a g : R" m> R'" ju bordovská funkuu- Pak složunú zobrazuní Y : íí R.m danú vzorcům Vú,1 £ Í3 : Y(ú,') = gŕXíú,1)) Jľ náhodná vuličina. Nazývá bu transformovaná náhod mi á volič ina, pro m = 1 iskalární. pro m > 'i vuktorová. Aby zobrazení Y: W ® Rm bylo náhodnou veličinou vzhledem k A , musí platit: "b e B m: Yinv(B) = {we W; y(©)e b}g A . Nechť tedy B e B m. Protože g je borelovská funkce, je ginv(B) e B n. Protože X je náhodná veličina, je Xinv(ginv(B)) e A . Ovšem Xinv(ginv(B)) = Yinv(B). Věta: Důkaz: 238 Transformovaná náhodná veličina Poznámka: (Příklady transformovaných náhodných veličin) Nechť X = (Xi, ..., Xn) je náhodný vektor. a) Nechť {i, ..., j} = {1, ..., n} - {k, ..., l}. Náhodný vektor (X i9 ..., Xj) se nazývá vybraný marginální vektor, (Xk, ..., Xl) se nazývá zbylý marginální vektor. Původní náhodný vektor (X1, ..., Xn) se v této souvislosti nazývá zbylý marginální vektor. n b) XXi,max{X1,K,Xn}, sin(xí)... jsou transformované náhodné veličiny. i=1 Definice: Posloupnost {Xn spočetně mnoha náhodných veličin definovaných na témžměřitelném prostoru (D, A ) se nazývá náhodná posloupnost. 239 Distribuční funkce náhodné veličiny Motivace: Při pozorování realizací náhodné veličiny si povšimneme, že některéjejí hodnoty se vyskytují světší pravděpodobností, jiné s menší. Pravděpodobnostní chování náhodné veličiny X budeme popisovat pomocídistribučnífunkce, kteráudávápravděpodobnost jevu, že náhodnáveličina X se realizuje hodnotou nejvýše x: "x e R: F(x ) = P (X £ x) Je to zidealizovaný protějšek empirické distribuční funkce zavedené vpopisné statistice: R:F(x )= N(X£x) n Lze očekávat, že srostoucím rozsahem výběrového souboru se budou hodnoty empirickédistribučnífunkce F(x) ustalovat kolem hodnot distribuční funkce i? je skalární náhodná veličina. Funkce : i? i-» i? daná vzorcem: V;í; g H : *(aí) = P (X < x) se nazývá distribuční funkce náhodné veličiny X. b) Nechť (íí, .4, P) je pravděpodobnostní prostor, X = (Xi,..., Xn) : í 3 i-> i?" je náhodný vektor. Funkce : i?" i-» i? daná vzorcem: V(tt,...,xn) G B" : $(x t,..., xn) = P(X\ (x) = P(X < x) = 6 + i+ I + i+ i = | 66 1 6 3 6 x e (6, o ): O(x) = P(X < x) = 6 + 6 + 6 + 6 + 6 + 6 = 6 = 1 0 12 3 4 5 6 ? 242 Vlastnosti distribuční funkce NV Věta *>: Nechť $(x) je distribiičrií funkce skalární náhodné veličiny X. Pak $(x) má následující vkus t non ti: a) ťI'(-':) j* neklesající, tj. V.t] < x-2 : (^i) < b) <Č(:c) je zprava spojitá, tj. pro libovolné, ale pevně dané x() € i? j*1 lim (.r) je normovaná, tj. lim <ř(,r) = 1, lim =0. d) Va, /j € ií, a < & => P(« < X < b) = $(&) - *(a). e) Pro libovolné, ale pevně dané xq € R : P(X = x$) = $(xn) ■ lirn <&(x). Důkaz: Jenom náznakem. ad a) Plyne z monotonie pravděpodobnosti P9. ad b) Plyne ze spojitosti pravděpodobnosti shora P17. ad c) lim F(x) = lim P (X £ x) = P (0) = 0 , lim F(x) = lim P(X £ x) = P(w) = 1 x —»-oo x —»-oo x —»oo x —»oo ad d) Plyne ze subtraktivity pravděpodobnosti P8. ad e) Plyne ze spojitosti pravděpodobnosti zdola P16. P9: Ai c A2 ^ P(A2) < P(A0 P17: a, □ Aj A =>pnAt -limP(Ai) '-..i-l J P8: Ai c A2 => P(A2 ■ ■ Ai) = P(A2) - P(A0 P16: A, c A2 c...e A = limp(Ai) 243 Příklad Příklad: Náhodná veličina X udává denní počet obsazených pokojů v určitém penziónu. Známe její distribuční funkci, tj. pravděpodobnost, že bude obsazeno nejvýše x pokojů: 0 pro x < 7 0,02 pro 7 £ x < 8 O(x) = Í0,05 pro 8 £ x < 9 0,12 pro 9 £ x < 10 1 pro x > 10 a) Určete pravděpodobnost, že v náhodně zvolený den bude obsazeno právě 7, 8, 9, 10 pokojů. b) Jaká je pravděpodobnost, že bude obsazeno nejvýše 10 a nejméně 8 pokojů? v Řešení: ad a) Využijeme vlastnost (e) z věty P(X = 7) = F(7)- lim F(x) = 0,02 - 0 = 0,02 x ®7 - P(X = 8) = F(8)- lim F(x) = 0,05 - 0,02 = 0,03 P(X = 9) = F(9)- lim F(x) = 0,12 - 0,05 = 0,07 x ®9 - P(X = 10)=F(10)- lim F(x) = 1 - 0,12 = 0,88 x ®10- ad b) Využijeme vlastnost (d) z věty -£4. P(8 £ X £ 10) = P(7 < X £ 10) = F(10) - F(7) = 1 - 0,02 = 0,98 244 Příklad Je funkce F(x) = sin x distribuční funkcí náhodné veličiny X v intervalu a) (0, n) , ? b) (o, */2 Řešení: a) NE b) ANO 245 Příklad Určete a) konstanty A, B tak, aby funkce F(x) = A + Be-x byla distribuční funkcí náhodné veličiny pro x e(0,oo), b) pravděpodobnost P(l < X < 4), Řešení: a) 0 = lim A + Be x = A + B lim ex = A + B x ®0 x ® 0 1 = lim A + Be"x = A + lim Be"x = A * B = -1 A=1 □) F (x) = 1 - e ~x b) P(1 < X < 4) = F(4) - F(1) = e-T1 = 0,3496 e 246 Vlastnosti distribuční funkce náhodného vektoru Věta "^B^-: Nechť ^(^1 ?. *,. xn) jc distribuční funkce náhodného vektoru X. Pak (X],.. ., xn) následující vlastnosti: a) ${xi,... ,xn) jc neklesající v/hledem ke každé jednotlivé proměnné. b) <&(xi,... ,xn) je /pravá spojitá whledem ke kačdé jednotlivé proménné. c) Hm ${x\..-.,!.,,) = 1 Vi e {L. ...n\ : lim ${xu ... ,xn) = 0 d) V(ar1?.... xn) e Än,V(/i],..., ň,J f AJ : P{xy < X\ < X] + h] A .., Aar„ < A"n < ar„ + /i.rtJ = <1>(íCi + /ii, -,. ,aj„ + /irt) - n íi 1 n -, X i -. - - - i X n. . x i -. — , x j, - - - , x n H~ fofi.)m e) Vi e {1?... ?n) : lim .. .?aľn) = X| _ 1 —>qc X^_|_l—>oc x„ —>oc 247 Vlastnosti distribučnífunkce náhodného vektoru Důkaz: Jenom náznakem. ad a), ad b) Podobně jako ve skalárním případě. ad c) lim o(xl5...,xn)= lim P(Xj £ x1 a... aXn £ xn)= P(Xj e R a... aXn e R)= P(q) = 1 "i e{l, ... ,n}: lim 0(x1?... ,xn )= lim P(X1 £ x1 a ... a Xi £ xi a ... a Xn £ xn ) = P(X1 £ x1 a ... a0 i a k a Xn £ xn )= P(0) = 0 ad d) Vlastnost vyjadřuje princip inkluze a exkluze. ad e) lim 0(xl5... ,xn )= lim P(X1 £ x1 a „. a Xn £ xn ) = P(X1 e R a ... a Xi £ xi a „. a Xn e R)= P(Wa „. a Xi £ xi a ... aW) = x1-1 ®¥ xj-1 ®¥ x1+1®¥ x1+1®¥ = P(Xi £ xi ) = Fi ) 248 Marginální/simultánní distribuční funkce Funkce Xi) j c distribuční funkce náhodne veličiny X. Nazývá se marginální distribuční funkce a 0, h2 > 0 nás zajímá pravděpodobnost, že náhodný vektor (x1;x2) se bude realizovat V obdélníku (x1,x1 + x(x2,x2 + h2): P (x1 < X1 £ x1 + h1 a x2 < X2 £ x2 + h2) = F(x1 + h1, x2 + h2)- F(x1 + h1, x2) - F(x1 , x2 + h2)+ F(x1 , x2) 251 Příklad Příklad: Náhodný vektor (X1? X2) má distribuční funkci 0(x1? x2) = -1-(arctg x1 + p) (arctg x2 + p). p2 2 2 Vypočtěte pravděpodobnost, že náhodný vektor (X1, X2) se bude realizovat v jednotkovém čtverci (0,1 x (0,1). Najděte obě marginální distribuční funkce 01(x1), 02(x2). Řešení: P(0 < X1 < 1 a 0 < X2 < 1) 01^) = limx2 0(1,1) - 0(1,0) - 0(0,1) + 0(0,0) P P \/n 1/rvi 7l\/7l 71 \ 1 1 4 + 7)(0 + f) - ^ (0 + +i) + ^ (0 4 2 2 p2 2 4 2 p2 + f )(0 + \) 16 02(x2) -y (arctg x1 + p) (arctg x2 + p) p2 2 2 1 /____^ .. 1 p, /____^ .. i p, _ 1 -(arctg x1 + p) P 2 = limx1 ®¥ — (arctg x1 + p) (arctg x2 + p) = - (arctg x2 + p) 1 p2 2 2 p 2 252 Existence distribuční funkce Věta: (existenční věta) a) Skalární případ: Jestliže funkce $>{x) má vlastnosti (a): (b). (c) / včty o vlastnostech distribuční funkce skalární náhodne veličiny, pak existuje pravděpodobnostní prostor {íí. Ar P) a na nem definovaná skalární náhodná veličina X tak. že je její distribuční funkce. b) Vektorový případ: Jestliže funkce <&(xiz... .xn) má vlastnosti (a), {b}. (c) z vety o vlastnostech distribuční funkce náhodného vektoru, pak existuje pravděpodobnostní prostor (íír>t P) a na nem definovaný náhodný vektor X = í A"i...,, Xn) tak, že 0 , je normovaná ^ p(x) = 1, x=—on s distribuční funkcí je spjata součtovým vztahemv"x g R : F(x) = ^ p(t) t £ x 254 Ilustrace vztahu mezi četnostní funkcí a pravděpodobnostní funkcí Provedeme n hodů kostkou. Zajímáme se o četnostní funkci počtu ok. n = 60: 0,20 p (x )o,io 0,05 0,00 o • w o • 0 1 2 3 4 5 6 7 n = 600: p ( x ) 0,20 0,15 0,10 0,05 0,00 01234567 n ® ¥: 0,20 0,15 p(x) 0,10 0,05 0,00 01234567 255 X X X Spojitá náhodná veličina - motivace Spojitá náhodná veličina nabývá všech hodnot z nějakého intervalu. Je to např. výsledek nějakého fyzikálního či chemického měření, hektarový výnos pšenice, hmotnost sériově vyráběného výrobku apod. Pravděpodobnostní chování spojité náhodné veličiny popisujeme hustotou pravděpodobnosti (p(x), což je zidealizovaný protějšek hustoty četnosti f(x) zavedené v popisné statistice v souvislosti s intervalovým rozložením četností. S rostoucím rozsahem výběrového souboru a klesajícími šířkami třídicích intervalů se budou hodnoty hustoty četnosti ustalovat kolem hodnot hustoty pravděpodobnosti. Vlastnosti hustoty četnosti se přenášejí i na hustotu pravděpodobnosti, tedy hustota pravděpodobnosti je nezáporná "x G R : j(x) > 0 , je normovaná s distribuční funkcí je spjata integrálním vztahem 256 Ilustrace vztahu mezi hustotou četnosti a hustotou pravděpodobnosti ■ Náhodně vybereme n sériově vyráběných součástek, změříme jejich délku a budeme se zajímat o hustotu četnosti odchylek těchto měření od deklarované délky součástky. n = 40, r = 4: f ( x ) n= 400, r = 8: f(x) n ® ¥, r ® ¥: j( x) 257 x x x Diskrétní náhodná veličina Definice: Xechť (Q.A.P) j*-? pravděpodobnostní prostor. X náhodná veličina defino váná na měřitelném prostoru (íl. A), která má distribuční íiinkcí $(x). Sekneme, že náhodná veličina X je diskrétní (vzhledem k práve když existuje reálná funkce ir(x}. která je nulová v R s výjimkou nejméně jednoho a nejvýše spočetné mnoha bodů. kde je kladná a platí pro ni: £ H. : $(x) = ^ ir(t). Tat,o funkce sen az ývá pr a v d čp i j d i ih i if i s 111 í fi i t ikre diskr é tni náli< 3 dne vel ičiny X. 258 Vlastnosti pravděpodobnostní funkce Věta: Nechť tt(x) je pravděpodobnostní funkce diskrétní náhodné veličiny X. Pak platí: a) Vjt £ R : tt(x) > 0 (vlastnost Dl nezápornost) b) 5^ ít(j:J = 1 (vlastnost D2 normovanost) 3ľ=— OO c) Vs e ií : 7r(a:) = P(JC = d) VB e B : P{X eB)= Y, Důkaz: ad a) Vlastnost D1 je součást definice. ad b) ľp(x)= lim ľp(x)= limF()= 1 x=—¥ x=—¥ ad c) P(X = x0)=F(x0)— lim F(x)= £p(t)— lim 5M0= lim )=p(x0) ad d) Označme G í R tu nejvýše spočetnou množinu, na níž p(x) nabývá kladných hodnot. Pak pro libovolnou borelovskou množinu B platí: P (X e B )= P(X e B n G)+ P (x e B n G )= pí X e II {x}l + 0 = £ P (X = x )=Jp(x ) xeBnG xeBn G xeB 259 Příklad z—■— Příklad: Náhodná veličina X udává počet líců při hodu dvěma mincemi. Určetejejí pravděpodobnostní a distribuční funkci a nakreslete jejich grafy. Řešení: Základní prostor: W = {[l,L] [l,R] [r,l] [r,R]}, jevové pole: maximální, pravděpodobnost: klasická, náhodná veličina X nabývá hodnot z množiny {0, i, 2}. p(o )= p (x = o )=1 x g(-¥'° ): F(x )= 0 p()= p(x = 1)= -4 2 x e (0,1): 0 (vlastnost Dl nezápornost) - b) E ■■ E ^fri ? ■ ■ ■ i rjr) = 1 (vlastnost T)2 normovanost i Jn=—oo c) ¥<*!,..., - + .xt}) = /J(A i = x\ A . . + A Xn = ;rfl) oo do oo e) V* € {1. ■ E E - E .....*«) = Il —oo Xi i -«It + 1 —oo jt, -oo Funkce tt^^) je pľavdejKMlobnostní funkce náhodné veličiny Xt. Nazývá se marginální pravděpodobnostní funkcu. Funkce ^"(jti ,....ín)aev této souvislosti nazývá simultánní pravděpodobnostní funkru, Podobně lze zavést marginální pravděpodobnostní funkce k proměnných. kde k Ě {2.3...../*—!}. 264 Příklad Příklad: Je dán systém složený ze dvou bloků. Pravděpodobnost, že i-tý blok správně funguje, je Ui, i = 1, 2 a pravděpodobnost, že správně fungují oba bloky, je u12. Nechť náhodná veličina Xi je ukazatel fungování i-tého Í1, pokud i - tý blok funguje [0, pokud i - tý blok nefunguje vektoru (X1, X2) a obě marginální pravděpodobnostní funkce n1(x1) a n2(x2). bloku, tj. Xi i 1, 2. Najděte simultánní pravděpodobnostní funkci n(x1, x2) náhodného Řešení: Hodnoty pravděpodobnostních funkcí zapíšeme do kontingenční tabulky. x1 x2 0 1 0 J 2 — J12 1 — J1 1 J1 — J12 J1 TC2(x2) 1 — J 2 J 2 1 n(0,0) = P(X1=0 a X2=0) = 1 - P(X1=1 v X2=1) = 1 - (U1 + u - U12) = 1 - U - U2 + U12 n(0,1) = P(X1=0 a X2=1) = P(X2=1) - P(X1=1 a X2=1) = U2 - U12 n(1,0) = p(x1=1 a X2=0) = p(x1=1) - p(x1=1 a X2=1) = u1 - u12 = P(X1=1 a X2=1) = U12 n(x15x2) = 0 jinak 265 Věta (existenčnívěta) a) Skalární případ: Jestliže funkce ir(x] má vlastnosti Dl. D2 z vety o vlast, no stech pravděpodobnostní funkce skalární náhodné veličiny, pak existuje prav děpodobnostní prostor (H. A. P) a na neru definovaná skalární diskrétní náhodná veličina X tak, že ir(x) je její pravděpodobnostní funkce. b) Vektorový případ: Jestliže funkce n(xt,... ,xn) má vlastnosti Dl. TY2 z věty o vlastnostech pravděpodobnostní funkce náhodného vektoru, pak exis tuje pravděpodobnostní prostor (Q.A.P) a na něm definovaný diskrétní ná hodný vektor X = (X\}..., Xn) tak, že (xt,... .xn) je jeho pravděpodobnostní funkce. 266 Spojitá náhodná veličina Definice: Xeohť (Q. A., P) je pravděpodobnostní prostor, X náhodná veličina deíino vaná na měřitelném prostom (Q. A), která má distribuční funkci Q (x), ftek neine. že náhodná veličina X je spojitá (vzhledem k P), práve když existuje po částech spojitá nezáporná reálná funkce (t)dt — ¥ — ¥ x Bude-li h dostatečně malé číslo, lze plochu pod grafem hustoty nahradit obsahem obdélníka o stranách (p(x) a h, tj. P(x < X < x + h)» j(x) h 268 Vlastnosti hustoty pravděpodobnosti Věta: Xc?chť }v hustota .spojité náhodné veličiny „V. Pak platí: a) Vj: 6 R : ^(x) > () (vlastnost Rl nezápornost) CC b) J ^p(t)(Ít = 1 (vlastnost S2 normovanost) — oo c) Vj: e R, VÄ > 0 : P(x< X < x + h) = j tp(t)(()dt = lim F(x)= 1 — ¥ —¥ x+h x+h x ad c) J 1020 40 pro 980 < x < 1020 1020 1 1 on P(X > 1000)= f — dx = — [xK = — = 0,5 v 7 J 40 40L J1000 40 1000 270 Příklad Napište distribuční funkci rozdělení daného hustotou f(x) = x/2 na (0, 1), 1/2 na (1, 2), (3 - x)/2 na (2, 3). Řešení: Na (0,1) : F (x) = j f (t) dt = j^dt = 2 1 2 ť_ L2J0 4 Na (1,2): F (x) = - + - (x — 1), 42 Na (2,3): F(x) ^-^-+ I 42 31 dt =--- 2 4 2 (3—t)2 ~ix J2 1 (3 — x )2 4 271 x Příklad Rozdělení náhodné veličiny X je dáno hustotou f(x) = 2x+2, na (-1, 0) a nulovou jinde. Najděte P(- 2 < X <-0,5). Řešení: 2,0 P (- 2 < X <-0,5 ) = P (-1 < X <-0,5 ) = = j(2x + 2) dx = 2 • 2 • 1 = 4 -1 -1 0 1 272 Příklad Náhodná veličina X má hustotu f (x ) a Určete a, distribuční funkci, p (x > Vš ). i + x na R. Řešení: i = í f (x) dx = a lim arctg (x) - lim arctg (x) 1 J \ x—»00 x®-¥ 0 —00 a p p —+ — 2 2 0 => a = i p \ i ( p } F ( x) = I f (x) dx = — arctg ( x) +— J p v 2 0 —¥ V / p (x >Vš )= i—f (Vš )= i— i (p i —+ - p 3 2 0 6 273 Spojitý náhodný vektor . Definice: Nechť (íl. Á. P) je pravděpodobnostní prostor. X = (X-\..... Xn) náhodný vektor definovaný na měřitelném prostom (íl. ^4). Nechť <&(xi 7..., xn) je jeho distribuční funkce. Sekneme, že náhodný vektor X je spojitý (vzhledem k P), práve když existuje po částech spojitá nezáporná reálná funkce ip{xir ■ ■ ■ jXn) tak. že pro i Vfaľi..... arn) E B.n : <3>(^i: ■ ■ ■ ■ xn) = j ... j ip(t-\..... tn)dt-\ ... dtn. Tato —oo — funkce se nazývá hustota pravdepodobnosti spojitého náhodného vektoru X. 274 Vlastnosti hustoty pravděpodobnosti Věta: Nechť cp(x19...,xn) je hustota pravděpodobnosti spojitého náhodného vektoru X = (X1, Xn). Pak platí: a) ¥(x\} .... xn) e Rn : ^(^1 ■ ■ ■ xn) ^ N (vlastnost fíl nezápornost) x. x b) J ... J - - - - xn)dxt ... flísCn = 1 (vlastnost S2 - normovanost) x —00 c) VB e Fř :iJ(x eS) = JX^i,...,^)^ ...2(x2) 1 p(1 +x22) 1 1 1 1 —00 1 1 277 9. Stochasticky nezávislé NV. ^| Vybraná rozložení. Motivace: Při provedení pokusu se může stát, že se realizace jedné náhodné veličiny Y dají jednoznačně určit ze známé realizace druhé náhodné veličiny X, tedy je mezi nimi funkční vztah Y = g(X). Takové náhodné veličiny se nazývají deterministicky závislé. Jejich protipólem jsou náhodné veličiny stochasticky nezávislé: informace o realizaci jedné z nich nijak nemění šance, s nimiž při témž pokusu očekáváme realizaci druhé. Např. náhodný pokus spočívá v hodu dvěma kostkami. Náhodná veličina X udává počet ok, která padla na 1. kostce a náhodná veličina Y udává počet ok, která padla na druhé kostce. Náhodné veličiny X, Y jsou stochasticky nezávislé. Stochastickou nezávislost náhodných veličin zavádíme na základě analogie s četnostní nezávislostí znaků v daném výběrovém souboru, která se používá v popisné statistice. Musí platit multiplikativní vztah: "(x, y) G R2 : p (x, y) = p1 (x ^ (y) pro bodové rozložení četností, v(xy) G R : f (x>y) = f1 (x)f2 (y) pro intervalové rozložení četností. V počtu pravděpodobnosti nahradíme četnostní funkci pravděpodobnostní funkcí resp. hustotu četnosti nahradíme hustotou pravděpodobnosti. Místo dvou náhodných veličin X, Y můžeme uvažovat n náhodných veličin: Náhodné veličiny X1, ..., Xn jsou stochasticky nezávislé, když platí: v diskrétním případě, V(x1, k , xn ) G Rn : j(x1, k , xn ) = j ) - k - j n ) ve spojitém případě, V(x1, k , xn ) G Rn : F(x1, k , xn ) = O1 ) - k - F n ) v obecném případě. 278 Stochasticky nezávislé náhodnéveličiny Definice: a) Obwný prípad: ftokneme* že náhodné veličiny X\,. > < + X„ s margiiiá) nimi distribučními funkwmi 4>i (x} + , . . +, A"ft s mar^i nálnínii hustotami ^i (xi).,. +. ^It(xIt) a simultánní hustotou 1(x0 = J24x12x2 (1-x1 )dx2 = 24x12 (1-x1) x2 ( 1(x1) = 0 jinak. 1 (2(x2) = J24x12x2 (1-x1 )dx1 = 24x2 34 h___xL_ 3 4 12x12 (1-x1) pro 0 < x1 < 1, 2x2 pro 0 < x2 < 1, ( 2(x2) = 0 jinak. Vidíme, že multiplikativní vztah je splněn, tudíž veličiny X1, X2 jsou stochasticky nezávislé. 2 2 0 0 0 0 281 Stochasticky nezávislé náhodnévektory Definice: Nechť (fM- /') jo pravděpodobnostní proslor* X i — (A 11 + *. ^ * Xpi i).. +>. Xíř — (Xini.. *, -X^^n) náhodné vektory definované na (íí. A* -P). Řekneme, že tyto náhodné vektory jsou sto cl m s t icky nezávislé, práve když každá složka náhod ného vektoru X> je stochasticky nezávislá se vSenii slož k ani i náhodného vektoru Xi pro Ví ^ k. Věta: Nechť X\i.,. iXn jsou stochasticky nezávisle naho dur veličiny, #1----.g1t borelovske funkce. Pak transformovane náhodne veličiny Y\ = g\(X\)..... Y„ = gniXjj) jsou opet stochasticky nezašle náhodné veličiny. (Tvrzení lze zobecnit i pro transformované náhodné vektory.) 282 Příklad Příklad: Nechť X15...,Xn jsou stochasticky nezávislé náhodné veličiny s distribučními funkcemi F1 (x1)Fn (xn). Zavedeme transformované náhodné veličiny Y = max{x1;...,Xn}, Z = min{x1;...,Xn}. Odvoďte jejich distribuční funkce Fmax(y)Fmin(z). Řešení: Fmax (y)= P(Y < y)= P(max{X1, ...,Xn }< y)= P(X1 < y a ... a Xn < y)= P(X1 < y>... • P(Xn < y)=F 1 (y)- ... Fn (y) Fmin (z)= P(Z < z)= P(min{X1, K,Xn }< z)= P(X1 < z v ... V Xn < z)= 1 — > z a ... A Xn > z)= 1 — P(X1 > z)- ... - P(Xn > z) = = 1 — [1 — P(X1 < z)]" ... [1 — P(Xn < z)]= 1 — [1 — F1 (z)]- ... [1 — Fn (z)] 283 Příklad Příklad: Na automatické lince jsou láhve plněny mlékem. Je známo, že množství mléka v láhvích kolísá od od 0,98 l do 1,02 l. V tomto intervalu považujeme každémnožství mléka za stejně možné. Za 1 sse naplní 3 láhve. Jakáje pravděpodobnost, že a) nejméně naplněná láhev obsahuje aspoň 1 l mléka, b) v nejvíce naplněné láhvi není víc než 1,01 l mléka? Řešení: Náhodná veličina Xi udává množství mléka v i-té láhvi, i = 1, 2, 3. Je to spojitá náhodná veličina, její hustota pravděpodobnosti je konstantní na intervalu (0,98; 1,02). Z podmínky normovanosti S2 dostaneme, že hustota Í0 prox e(-¥,980) prox e (980,1020) 40 [0 jinak Distribuční funkce: F(x)= í — dt =—[xL = x-980 proxe (980,1020) 980 40 [1 proxe (1020,«) ad a) P(Z > 1000)= 1 - P(Z < 1000)= 1 - Fmin (1000)= [1 - 0(1000)] 3= 1000 - 980 40 í11 v 2 , =1 = 0,125 8 ad b) p(y < 1010)= F max (1010)= [F(1010)] 3= f 3 ^3 v 4 27 64 0,42 3 3 284 Vybraná rozložení diskrétních a spojitých náhodných veličin Motivace Nyní se seznámíme s přehledem důležitých pravděpodobnostních funkcí a hustot pravděpodobnosti. Uvedeme nejenom analytické vyjádřenítěchto funkcí, ale téžjejich grafy. Vysvětlíme rovněž, v jakých situacích se lze s uvedenými rozloženími pravděpodobností setkat. Zvláštní pozornost budeme věnovat normálnímu rozložení, které hraje velkou roli v celé řadě praktických aplikacípočtu pravděpodobnosti i v matematickéstatistice. Označení Známe-li distribuční funkci O(x) náhodné veličiny X (resp. pravděpodobnostní funkci n(x) v diskrétním případě resp. hustotu pravděpodobnosti (p(x) ve spojitém případě), pak řekneme, že známe rozložení pravděpodobností (zkráceně rozložení) náhodné veličiny X. Toto rozložení závisí na nějakém parametru J, cožje nejčastěji reálné číslo nebo reálný vektor. Zápis X ~ L( J) čteme: náhodná veličina X má rozložení L s parametrem J. Na webu: http://en,wikipedia,org/wiki/List of probability distributions 285 Vybraná rozložení diskrétních náhodných veličin Důležitá diskrétní rozdělení: > Degenerované rozložení > Alternativní (Bernoulliho) rozdělení > Binomické rozdělení > Multinomické rozdělení > Poissonovo rozdělení > Negativně binomické (Pascalovo) rozdělení Geometrické rozdělení (zvláštnípřípad negativně binomického rozdělení) > Hypergeometrické rozdělení > Rovnoměrné rozdělení 286 Degenerovanérozložení Degenerované rozložení: Náhodná veličina X nabývá pouze konstantní hodnoty m, píšeme X ~ Dg( m ). 1 pro x = m 0 jinak Pravdep. funkce Dg(1) 287 Alternativní rozložení Alternativní rozložení: Náhodná veličina X udává počet úspěchů v jednom pokusu, přičemž pravděpodobnost úspěchu je J. Píšeme X ~ A( J). 1 — J pro x = 0 ( . X1 01 u v r \ JJx (1 — J) x pro x = 0, 1 J pro x = 1 neboli n(x) = í v 7 ^ 0 jinak ^°jinak 288 Binomické rozložení Binomické rozložení: Náhodná veličina X udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu je v každém pokusu J. Píšeme X ~ Bi(n, J ). v x J J x(1 — J)n—x pro x = 0, ..., n 0 jinak (Alternativní rozložení je speciálním případem binomického rozložení pro n = 1. Jsou-li X1, Xn stochasticky nezávislé náhodné veličiny, Xi ~ A( J ), i = 1, n, pak X = ^ Xi Pravdep. funkce Bi(5,0.5) i=1 Bi(n, J).) 289 Příklad Příklad na binomické rozložení pravděpodobností: Firma se účastní čtyř nezávislých výběrových řízení. Pravděpodobnost, že uspěje v kterémkoliv z nich, je pro všechny konkurzy stejná a je rovna 0,7. Jaká je pravděpodobnost, že firma uspěje a) právě 2x b) aspoň 2x c) nejvýše 2x? Řešení: X ... počet úspěšných konkurzů, X ~ Bi(4; 0,7) ad a) P(X = 2 ) = p(2 ) = v 2 y 0,720,32 = 0,2646 ad b) P(X > 2) = p(2) + p(3) + p(4) = í 4 ] í 4 ] í 41 0,720,32 + 0,730,3+ v 2 y v 3 y v 4 y 0,74 = 0,9163 ad c) P(X £ 2) = F(2) = p(0) + + p(2) = v0y 0,34 + v1 y 0,7 • 0,33 + v2y 0,720,32 = 0,3483 290 Příklad Pravděpodobnost narození chlapce je 0,515. Určete takový počet dětí, aby pravděpodobnost, že mezi nimi bude aspoň jeden chlapec, byla vetší než 0,99. Řešení: Označme jako X veličinu udávající počet chlapců mezi n dětmi, je X~Bi(n,0,515). Hledáme takové n, aby P(X >0) > 0,99, přitom platí P (X > 0 ) = 1 — P (X £ 0 ) = 1 — P (X = 0 ) = 1 — ^=> 1 — (0,485)n > 0,99 ' n ^ V 0 0 0,5150 • (1 — 0,515) n—0 ln 0,01 n >-@ 6,36 ln0,485 n > 7 291 Multinomické rozložení Multinomické rozložení: Zobecnění binomického rozložení. Složky náhodného vektoru (Xp...Xk) udávají počty úspěchů (nastane jev A1?...Ak) v posloupnosti n nezávislých opakovaných pokusů, přičemžpravděpodobnosti úspěchů jsou J,..., Jk. Předpokládáme, že při každém pokusu nastane právě jeden z jevů A1v. .Ak , přičemž platí J +,...,+Jk = 1. Píšeme X ~ Mu (n,J1,..., Jk) n! 0 jinak Platí: Xy ~ Bi(n,Jj) 292 Multinomické rozložení-příklady využití > Předvolební průzkum: ■ n - počet tázaných ■ Jj -skutečný podíl voličů j-té strany v populaci ■ Xj - počet (četnost) voličů j-té strany ve výběru > Hody hrací kostkou: ■ n - počet hodů ■ J,..., J6 - pravděpodobnost jednotlivých stran kostky ■ X1?...X6 - absolutní četnosti jednotlivých stran kostky > Krevní skupiny: ■ n=4 (skupiny 0,A,B,AB) ■ J0, JA ,JB, JAB - pravděpodobnosti skupin 0, A, B, AB ■ X0, XA, XB, XAB - počty osob se skupinami 0, A, B, AB 293 Poissonovo rozložení Poissonovo rozložení: Náhodná veličina X udává počet událostí, které nastanou v jednotkovém časovém intervalu (resp. jednotkové oblasti), přičemž události nastávají náhodně, jednotlivě a vzájemně nezávisle. Parametr X > 0 je střední počet těchto událostí. Píšeme X ~ Po(X). (Poissonovým rozložením se řídí např. počet výzev, které dojdou na telefonní ústřednu během určitého časového intervalu nebo počet mikroorganizmů v zorném poli mikroskopu. Jde o tzv. řídce se vyskytující jevy.) 1x x — e pro x = 0, 1, ... x! 0 jinak 294 Příklad Vztah mezi pravděpodobnostní funkcí binomického a Poissonova rozložení: Nechť náhodná veličina X ~ Po(X) a náhodná veličina Y ~ Bi(n, Jn). Nechť Jn 0 pro n — oo a přitom nJn — X. Pak pravděpodobnostní funkce náhodné veličiny Y konverguje k pravděpodobnostní funkci náhodné veličiny X, tj. lim n ®¥ ( n A V y 0 (Aproximace binomického rozložení pomocí Poissonova rozložení je vyhovující, když n > 30 a J < 0,1.) Příklad na Poissonovo rozložení: Dělnice v prádelně obsluhuje 800 vřeten. Pravděpodobnost toho, že se příze přetrhne během časového intervalu délky t, je pro všechna vřetena stejná a je rovna 0,005. Určete pravděpodobnost, že během intervalu délky t dojde k nejvýše 10 přetržením. Řešení: Y - počet přetržení v časovém intervalu délky t, Y ~ Bi(800;0,005). 10 (800^ Přesný výpočet: p(y £ 10) ~ ^, , 0,005y (1 - 0,005)800"y = 0,997239 Aproximativní výpočet: podmínky dobré aproximace jsou splněny, parametr 10 4y X = n J = 800.0,005 = 4,P(Y < 10) = £ — e-4 = 0,9971602 295 Příklad 1) Průměrný telefonní hovor trvá 1,5 min. Má-li ústředna 10 linek a dochází-li průměrně k 120 hovorům za hodinu, jakáje pravděpodobnost ztráty volání? Řešení: X udává počet volajících, X~Po(2*1,5). Ke ztrátě volání dojde, pokud chce současně volat více než 10 volajících (tj. není volná linka). Tedy 10 3 x P (X > 10 )= 1 - P (X £ 10 )= 1 -X — e ~3 @ 0,001. 2) Průměrný telefonní hovor trvá 1,5 min. Kolik linek musí ústředna mít, dochází-li průměrně k 240 hovorům za hodinu a pravděpodobnost ztráty volánínemápřekročit a) 0,01, b) 0,001? Řešení: X udává počet volajících, X~Po(240/60*1,5). Hledáme n tak aby P(X > n) £ 0,01 tj. P(X £ n)> 0,99 ^=> X — e- > 0,99 Pro případ b) chceme X—e 6 > 0,999 n = 12. n = 15. 296 Negativní binomické (Pascalovo) rozložení Negativní binomické rozložení (Pascalovo): Náhodná veličina X udává počet neúspěchů před n-tým úspěchem v posloupnosti n nezávislých opakovaných pokusů,přičemž pravděpodobnost úspěchu je v každém pokusu J. Píšeme X ~ NB(n, J). r p( x) n + x -1^ v 0 x 0 Jn(1 -J)), x = 0,1,k, 0 < J < 1 jinak NB(2,0.2) a NB(2,0.4) o,: 0,1 c • • O s: o o o > Negativně binomické rozdělení lze definovat obecněji. Tak jak je zde uvedeno jde o rozdělení Pascalovo. 297 Geometrické rozložení Geometrické rozložení: Náhodná veličina X udává počet neúspěchů v posloupnosti opakovaných nezávislých pokusů předcházejících prvnímu úspěchu, přičemž pravděpodobnost úspěchu je v každém pokusu rovna J. Píšeme X ~ Ge( J) (l — J)x J pro x = 0, l, ... 0 jinak Pravdep. funkce Ge(0.25) 298 Příklad Dva hráči střídavě házejí kostkou. Vyhrává ten, kdo první hodí šestku. Jaká je pravděpodobnost, že vyhraje ten, který začínal? Řešení: X udává počet nehození šestky (neúspěch) před prvním hozením šestky (úspěch), X ~ Ge(1/6). Hledáme tedy pravděpodobnost jevu A: 1. úspěch po sudém počtu neúspěchů. 2 k 299 Hypergeometrické rozložení Hypergeometrické rozložení: V souboru N prvků je M prvků označeno. Náhodně vybereme n prvků bez vracení. Náhodná veličina X udává počet vybraných označených prvků. Píšeme X ~ Hg(N, M, n) tc(x) v x a N - M n - x N vn 0 ■ pro x = max {0, M - N + n}, ..., min{M, n} 0 jinak 300 Příklad V klobouku jsou 3 černé a 4 bílé koule. Určete pravděpodobnost, že při vytažení 3 koulí budou aspoň 2 černé. Řešení: X udává počet vytažených černých koulí, X ~ HG(7,3,3). Hledaná pravděpodobnost je Í3Y4>1 Í3Y4>1 + P (X > 2 ) = 1 - P(X £ 1) = 1 - V 0 A 3 0 V10V20 í 71 v 3 0 1 -1.4 + 3.6 = 1 - 22 = 13 = 0,371. 35 35 35 301 Rovnoměrné diskrétní rozložení Rovnoměrné diskrétní rozložení: Nechť G je konečná množina o n prvcích. Náhodná veličina X nabývá se stejnou pravděpodobností každé hodnoty z množiny G. Píšeme X ~ Rd(G) í 1 G — pro x g G n(x) = i n 0 jinak (Typickým příkladem je náhodná veličina udávající počet ok při hodu kostkou.) Pravdep. funkce Rd({1,2,...,10}) 0.18i 0 1 2 3 4 5 6 7 8 9 1011 302 Vybraná rozložení spojitých náhodných veličin Důležitá spojitá rozdělení: > Rovnoměrné rozdělení > Normální rozdělení (označované takéjako Gaussovo rozdělení) > Logaritmicko-normální rozdělení (také log-normální rozdělení) > Studentovo rozdělení > Fischerovo-Snedecorovo rozdělení > X2 rozdělení (Chí-kvadrát) > Cauchyho rozdělení > Exponenciální rozdělení > Laplaceovo rozdělení (nebo také dvojitě exponenciální rozdělení) > Weibullovo rozdělení 303 Rovnoměrné spojité rozložení Rovnoměrné spojité rozložení: Předpokládejme, že veličina X - může nabýt jakékoliv hodnoty mezi čísly a, b - pravděpodobnost, že nabude hodnoty z jakéhokoliv intervalu v tomto rozmezí je stejná jako pravděpodobnost, že nabude hodnoty z jakéhokoliv jiného intervalu stejné délky. Jsou-li tyto podmínky splněny, pak X má rovnoměrné spojité rozložení na intervalu (a, b). Hustota pravděpodobnosti náhodné veličiny X je konstantní na intervalu (a, b) a plocha pod křivkou hustoty tvoří obdélník. Píšeme X ~ Rs(a, b). (p(x) 1 b-a 0 jinak pro x e (a, b) f ( x) = 0 x - a b - a 1 x x £ a e (a, b) x > b 304 Normální rozložení Normální rozložení: Tato náhodná veličina vzniká např. tak, že ke konstantě p se přičítá velké množství nezávislých náhodných vlivů mírně kolísajících kolem nuly. Proměnlivost těchto vlivů je vyjádřena konstantou a > 0. 1 2 Píšeme X ~ N(p, a ), hustota (p(x) Gaussova křivka. LU -E -4 -I -ľ 2p 2a2 1 1— • 1 • i 1 1— 1 \ rJ = Ů, tf^lJ],- 1^ = ij, tf^BJl,— r = -2.tfi=D£1 — / \ í \ - 1 \ Ä -i Grafem této hustoty je tzv. 305 Galtonova deska Ilustrace vzniku normálního rozložení pomocí Galtonovy desky: Deska obsahuje n řad pravidelně uspořádaných klínů, a to tak, že v k-té řadě je právě k klínů. Do otvoru nahoře padají kuličky, které jsou v každé řadě se stejnou pravděpodobností 1/2 vychylovány vlevo nebo vpravo. Pod poslední radou je n 1 přihrádek, ve kterých se kuličky shromaždují. Nasypeme-li do tohoto systému velké množství kuliček, vytvoří v přihrádkách jakýsi "kopec", jehož tvar je velmi podobný tvaru grafu hustoty náhodné veličiny s normálním rozložením. Náhodné vychylování kuliček jednotlivými řadami překážek je možno chápat jako speciální případ velkého množství chybových faktorů, náhodně působících na nějaký proces, jako působení mnoha blíže nespecifikovatelných vlivů, které ovlivňují zcela náhodně rozložení jeho výsledku. Obrázek 306 Standardizované normální rozložení Standardizované normální rozložení: 2 Pro |i = 0, a = 1 se jedná o standardizované normální rozložení, píšeme U ~ N(0, 1). Hustota pravděpodobnosti má v tomto případě tvar q>(u) 1 V2P u2 " 2 Hustota N(0,1) u 1 -1 2 0, pro u < 0 se používá přepočtový vzorec O(-u) = 1 - O(u). 307 Příklad v Příklad na normální rozložení: Výsledky u přijímacích zkoušek na jistou VS jsou normálně rozloženy s parametry |i = 550 bodů, a = 100 bodů. S jakou pravděpodobností bude mít náhodně vybraný uchazeč aspoň 600 bodů? Řešení: X - výsledek náhodně vybraného uchazeče, X ~ N(550, 100 ), P(X > 600) = 1 - P(X < 600) + P(X = 600) = 1 - P(X < 600) = =1 - P ( x-m £ 600- s s 1 - P [u £ 600 - 550 100 1 - 0(0,5) = 1 - 0,69146 = 0,30854. Normální rozložení - vlastnosti Některé vlastnosti normálního rozložení: Jestliže x~ n (m, s2), pak u = X—m ~ n (0,1). s Jestliže x~ n (m, s2), a y = a + bx, pak y~ n (a + bm,b2 s2). Jestliže x15 ... ,xn jsou stochasticky nezávislé náhodné veličiny, xi N(mi, si2), i = 1, ... ,n, Y = J Xi, pak Y i=1 N 2> i. Z i=1 i=1 2 Význam normálního rozložení: Normální rozložení hraje ústřední roli v počtu pravděpodobnosti i matematické statistice. Jeho význam spočívá jednak v tom, že normálním rozložením se řídí pravděpodobnostní chování mnoha náhodných veličin a jednak v tom, že za určitých podmínek konverguje k normálnímu rozložení součet nezávislých náhodných veličin s týmž rozložením (viz centrální limitní věta). „koncentrace hodnot" normální NV: Přes 68% hodnot „leží" v intervalu (u-g, jj+g). Přes 95% hodnot „leží" v intervalu (u-2g, u+2g). Přes 99% hodnot „leží" v intervalu (u-3g, u+3g). Dvojrozměrné normální rozložení Definice: O spojitém náhodném vektoru X = říkáme, že má dvojrozměrné normální rozložení s parametry /í= |j^J aE= | p&l 0 312 Pearsonovo x2 rozložení Pearsonovo rozložení chí-kvadrát s n stupni volnosti: Nechť X1, Xkjsou stochasticky nezávislé náhodné veličiny, Xi ~ N(0, 1), i = 1, k. Pak náhodná veličina X = X12 + ... + Xk2 ~ %2(k). j( x, k ) 1 = < 2k/2 -r( k /2) 0 jinak G(s) = je- • ts-1 dt 313 0 Studentovo rozložení Studentovo rozložení s n stupni volnosti: Nechť X1, X2 jsou stochasticky 2 nezávislé náhodné veličiny, X1 ~ N(0, 1), X2 ~ % (n). Pak náhodná veličina X X, X2 n t(n). cp(x, n) = n +1 0 4ňňň G ( n I2) 1 + x n+1 2\ ~ n 0 x e (-¥, oo) 0.40 0.35 0.30 0.25 ~0.20h 0.15 // \ ^°'4 -2 0.0 -1- ■ / n =1 / n =2 / n =5 — n — 00 1 -4 -2 314 Fisher-Snedecorovo rozložení Fisherovo-Snedecorovo rozložení s nx a n2 stupni volnosti: Nechť Xb X2 jsou 2 stochasticky nezávislé náhodné veličiny, Xi ~ % (ni), i = 1, 2. X /n Pak náhodná veličina X = —1—1— F(nb n2). X2 / n2 ^ n1 + n2 ^ 2 ni / 2 n2 / 2 n1 n2 0 r(n1/2 )r(n2/2 ) v ( n2 x(n1 -2)/2 A + n1 x )(n1+n2)/2 pro x > 0 c T 2 n1 = 1, n2 = 1 n1 = 2, n2 = 1 n1 = 5, n2 = = 100, n2 2 n1 = 1 n1 = 100, n2 = 100 315 Cauchyho rozložení Cauchyho rozložení pravděpodobnosti s parametry x0 a y, pro -¥< x0 < ¥ a y > 0, je definováno hustotou pravděpodobnosti ve tvaru ^ ^7|l + (^) 1 7T (x - x0)2 + 72J kde x0 je parametr, určující umístění největší hodnoty rozdělení. Zvláštnípřípad, kdy x0 = 0 a y = 1 se nazývá standardní Cauchyho rozdělení s hustotou pravděpodobnosti vyjádřenou vztahem j( x;0,1) 1 7ľ(l + X2) Standardní Cauchyho rozděleníje speciální případ Studentova rozdělení(pro n = 1). 316 Exponenciální rozložení Exponenciální rozložení: Náhodná veličina X udává dobu čekání na příchod nějaké události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. (Jde o tzv. čekání bez paměti.) Přitom vyjadřuje střední dobu čekání. Píšeme X ~ Ex(^) ( (x) le- 1x pro x > 0 0 jinak O(x) 1 - e-1x pro x > 0 0 jinak 317 1 Příklad Příklad na exponenciální rozložení: Doba (v minutách) potřebná k obsloužení zákazníka v prodejně potravin je náhodná veličina, která se řídí rozložením Ex í -1. Jaká je pravděpodobnost, že doba potřebná k obsloužení náhodně vybraného zákazníka v této prodejně bude v rozmezí od 3 do 6 minut? Řešení: X - doba potřebná k obsloužení náhodně vybraného zákazníka, X ~ Ex P(3 < X < 6) 6 i x 1 -e-2 + e-1 = 0,233. !3 3 L S pravděpodobností 0,233 bude zákazník obsloužen v době od 3 do 6 minut. Laplaceovo rozložení Laplaceovo rozložení: Náhodná veličina, která vznikne rozdílem dvou NV z exponenciálního rozložení, se řídí tímto rozložením. Využití ve fyzice, ekonomii - Brownův pohyb. Hustota je dána vzorcem j( x; m, b) T^i-xp \x — fi\ Platí např.: X ~ Laplace(0, b) =^> X ~ Ex V b 0 X1 ~ Ex (Aj), X2 ~ Ex (12) => Aj X1 -12 X2 ~ Laplace(0,1) 319 Weibullovo rozložení Weibullovo rozdělení: Náhodná veličina X ~ Wb(ô, s) vyjadřuje dobu čekání na něěakou událost, která se každým okamžikem může dostavit se šancí úměrnou mocninné funkci pročekané doby. Přitom čísla ô > 0 a s > 0se nazývají parametry měřítka a formy. j( x;ô, e) e - ô - x e 0 pro x > 0 pro x £ 0 Jiná forma zápisu: - (- 1 1 V10 j( x; 1, k) k-1 = < e ( x ^k V 1 0 0 Ä = 1, k = 0,5 Á = 1. k = 1 Ä = 1. k = 1.5 A « 1. k « 5 pro x > 0 pro x £ 0 320 2.5 10. Rozložení transformovaných NV. Číselné charakteristiky NV. Motivace: Máme náhodnou veličinu X s distribuční funkcí O(x) (resp. pravděpodobnostní funkcí 7i(x) v diskrétním případě resp. hustotou (p(x) ve spojitém případě) a borelovskou funkci g: R — R. Zavedeme transformovanou náhodnou veličinu Y = g(X) a hledáme její distribuční funkci 0*(y) (resp. pravděpodobnostní funkcí n*(y) v diskrétním případě resp. hustotu ( *(y) ve spojitém případě). Věta: Nechť X je diskrétní náhodná veličina s pravděpodobnostní funkcí n(x) a g je borelovská ryze monotónní funkce, tedy v oblasti C í R existuje inverzní funkce g-1 = t. Pak pravděpodobnostní funkce n*(y) transformované náhodné veličiny Y = g(X) má tvar: p(t(y))proy g C (y )■ 0jinak (y ) = p(y = y ) = P(g (x ) = y ) = p (x Důkaz: Příklad: X ~ n(x), Y = a + bX, n*(y) = ? Rešení: a) b ^ 0: p * (y) = P(Y = y) = P(a + bX = y) = P| b) b = 0: Y = a Y ~ Dg(a) -1 (y)) = P(X = t(y)) = p(t(y)) pro y g C, n*(y) = 0 j inak. f X = y - a ^ =p f y - a 1 v b J V b J 321 Rozloženítransformované spojité náhodné veličiny Věta: Nechť X je spojitá náhodná veličina s hustotou ((x) a g je borelovská ryze monotónní funkce se spojitou a nenulovou derivací v R, tedy v oblasti C í R existuje inverzní funkce g-1 = t se spojitou a nenulovou derivací. Pak hustota (p*(y) transformované náhodné veličiny Y = g(X) má tvar: íj(t(y(y)proy e c Důkaz: P(X £ t(y)) = F(t(y)) pro g rostoucí P(X > t(y)) = 1 - F(t(y))pro g klesající dF * (y) = [cp(t(y ))ť (y) pro g rostoucí j(t(y ))ť (y )pro g klesající F * (y ) = P(Y £ y ) = P(g(X)£ y ) = dy Příklad: X ~ Rs| Řešení: j(t(y(y) pro y e C, (p*(y) = 0 jinak 2'2 0 , Y = tg X, q>*(y) = ? 1 pro x pp 22 J ? p [0 jinak F * (y) = P(Y £ y) = P(tg(X) £ y) = P(X £ arctg(y)) = F(arctg(y)) 1 = 1 p(1+y2) / \ dF * (y) / / Xx j *(y) = —= j(arctg(y)): 2 dy 1+ y Říkáme, že Y má Cauchyovo rozložení, píšeme Y ~ t(1). 322 Nemonotónní transformace Věta: Není-li transformační funkce g ryze monotónní, pak mezi X a Y neexistuje vzájemně jednoznačný vztah. Distribuční funkce transformované náhodné veličiny Y se vypočte podle vzorce: f * (y) = p(x g a1)+ p(x g a 2) + ... . kde a1.a2.... jsou ty intervaly, pro které Y < y. Příklad: X ~ N(0.1). Y = X2. (p*(y) = ? Řešení: /2 p f * (y) = P (Y £ y) = P (x2 £ y) = P (- ^ £ X £ Vy) = ) - f(- ) = f(V7)- [1 - f(V7 ) = =2f(vy)-1 ' ' y 1 y ( ) dF * (y) 2 ( r-) 1 1 -í 1 e 2 pro y > 0. (p*(y) = 0 jinak dy 2^Jy V2P -yjy ^2py 22 Y má x rozložení s jedním stupněm volnosti, píšeme Y ~ x (1). j( x, k) • xk/2-1 • e- x/2 x > 0 0 y/nak r 323 1 Rozložení transformovaného náhodného vektoru Věta (transformace náhodného vektoru X = (X_, ..Xn) na skalární náhodnou veličinu Y = g(X_, ..Xn)) a) Diskrétní případ: X = (X_, ..., Xn) ~ n(x_, ..., xn), g: Rn —> R je borelovská funkce => Y = g(x_, xn) ~n*(y_, yn) = £ -^p(x_,...), kde S(y)={(x_,K,xn)e Rn;g(x^...^)= y} (xi,...xn )s(y) b) Spojitý případ: X = (X_, ..Xn) ~ 9 (x_, ..xn), g: Rn —» R je borelovská funkce == Y = g(xl, xn) ~ 9 *(yb yn) = -p |(y)K jj(xi,...,xn>ixi•••dxn , kde S(y)={(xi,...,xn)e Rn;g(x_,...)< y} 324 Věta o konvoluci Věta (věta o konvoluci) a) Diskrétnípřípad: Xi, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ n i(xi), i = 1, 2 => ¥ ¥ Y = X1 + X2~ n*(y) = (x1 X (y - x1 )= IX (y - x2 )T2 ) 7i*(y) se nazývá konvoluce funkcí 7n(x1), 7i2(x2). b) Spojitý případ: X1, X2 jsou stochasticky nezávislé náhodné veličiny, Xi ~ (pi(xi), i = 1, 2 => ¥¥ q>*(y) se nazývá konvoluce funkcí q>1(x1), q>2(x2). 325 Příklad Příklad: X1, X2 jsou stochasticky nezávislé náhodné veličiny, X ~ Po(Xi), i = 1, 2, Y = X1 + X2, n * (y) = ? Řešení: p i (Xi )= —^-e i proxi = 0,1, ... 0 jinak 00 y x1 =-00 y - x1 x1 =0 x1! e-X 2 = e-(X1 +X2 ) J_ JI y x1 =0 X 1x, x2y-x1 = (X 1 +X2 > e-(x+x2) pro y = 0,1, k (y - x1) V x10 1 y! n*(y) = 0 jinak. Vidíme, že Y ~ Po(X1 + X2). Zobecnění: X1, Xn jsou stochasticky nezávislé náhodné veličiny, Xi ~ Po(Xi), i = 1, 2, n => Y = X1 + ...+ Xn~ Po(X1 + ...+ Xn). 326 Lineárnítransformace náhodného vektoru Věta (lineární transformace n-rozměrného náhodného vektoru) Nechť X = (X1, ..Xn)' je náhodný vektor, a = (a1, ..an)' je reálný vektor a B = (bjXj^ n je reálná čtvercová pozitivně definitní matice (tj. "x g Rn je kvadratická funkce x'Bx > 0). Pak pro rozložení pravděpodobností transformovaného náhodného vektoru Y = a + BX platí: a) Diskrétnípřípad: |n*(y) = n(B-1(y -a))| j*(y) = det(B) 1(p(ľ~l(y - a)) b) Spojitý případ: Věta: Nechť náhodný vektor X = (X1, ..Xn)' má n-rozměrné normální rozloženíNn(n, L). Položme Y = a + BX. Pak Y ~Nn(a + Bfi, BLB'). 327 Číselné charakteristiky náhodných veličin Motivace: Doposud jsme pracovali s funkcionálními charakteristikami náhodných veličin (např. distribuční funkce, pravděpodobnostní funkce, hustota pravděpodobnosti), které plně popisují pravděpodobnostní chování náhodné veličiny. Číselné charakteristiky vystihují pouze některé rysy tohoto chování, např. popisují polohu realizací náhodné veličiny na číselné ose či jejich proměnlivost (variabilitu). Jsou jednodušší než číselné charakteristiky, ale nesou jen částečnou informaci. Podobně jako v popisné statistice volíme vhodnou číselnou charakteristiku podle toho, jakého typu je daná náhodná veličina - zda je ordinální nebo intervalová či poměrová. Číselné charakteristiky znaků mají své teoretické protějšky v číselných charakteristikách náhodných veličin. Definice: Nechť X je náhodná veličina aspoň ordinálního charakteru a a g (0,1). Číslo Ka(X) se nazývá a-kvantil náhodné veličiny X, ^ \ /ml ■> |_ K^25(X) dolní kvartil, Koj5(X) horní kvartil, kvantily K^X), K),90(X) jsou decily, K),01(X), K0,99(X) jsou percentily. Kterýkoliv a-kvantil je charakteristikou polohy číselných realizací náhodné veličiny na číselné ose. Jako charakteristika variability slouží kvartilová odchylka q = K075(X) - K025(X). jestliže splňuje nerovnosti: P(X £ K a(X ))>a a P(X > K a(X ))> 1 -a Kvantil K050(X) se nazývá medián, Jiné možné označení kvantilu: xt 328 Kvantil spojité NV Důsledek: (pro spojitou náhodnou veličinu) K a (X) Je-li X spojitá náhodná veličina, pak Ka(x) je takové číslo. pro které platí: a = f(ka(x)) = jjp(x)dx -00 Ilustrace: 329 Příklad Příklad: Nechť X ~ Ex(1). Určete medián a kvartilovou odchylku. ^ v r í \ í e-xprox > 0 / x |1 - e-xprox > 0 Řešení: j(x ) = í , F(x ) = í l0jinak l0jinak a = F(K a(X )) = 1 - e - K a(X U K a(X )=-ln(1 -a) K050 (X) = - ln(1 - 0,5) = - ln1 = ln2 = 0,693 K0 25 (X) = - ln(1 - 0,25) = - ln- = ln4 - ln3 = 0,288 K0 (X) = - ln(1 - 0,75) = - ln - = ln4 = 1,386 4 K0 75 (X)- K0 25 (X) = 1,386 - 0,288 = 1,098 Dolní kvartil Medián 0,2 0,6 1.0 1,4 1.8 2,2 2,6 3,0 3,4 3,8 4,2 4.6 Horní kvartil 0,2 0.6 1.0 1,4 1,8 2,2 2,6 3,0 3,4 3,8 4,2 4,6 0,2 0,6 1:0 1,4 1,8 2,2 2,6 3,0 3.4 3,8 4.2 4.6 330 Kvantily vybraných rozložení NV Označení: X ~ N(0, 1) => K„(X) = Ua, X ~ x2(n) Ka(X) = x2a(n), X ~ t(n) => Ka(X) = ta(n), X ~ F(m, n2) => Ka(X) = Fa(ni, n2). Tyto kvantily najdeme ve statistických tabulkách. Při jejich hledání používáme vztahy: Kvantily lze také vypočítat pomocí statistického software. Příklad: a) Nechť U ~ N(0, 1). Najděte medián a horní a dolní kvartil. b) Určete x20,025(25). c) Určete %9(30) a %5(14). d) Určete F0,975(5, 20) a F0,05(2, 10). Řešení: ad a) U0 50 = 0, U0 25 = -0,67449, U0 75 = 0,67449 ad b) x20,025(25) = 13,12 ad c) t0,99(30) = 2,4573, t0,05(24) = -1,7613 ad d) F0,975(5, 20) = 3,2891, F0,05(2, 10) = 0,05156 Kvantily transformované NV Věta: Nechť X je spojitá náhodná veličina s distribuční funkcí f(x), a g (0,1) a g : R ® R ryze monotónní borelovská funkce. Pak pro a-kvantil transformované náhodné veličiny Y = g(X) platí: a) Je-li g všude rostoucí funkce, pak Ka(Y) = g(Ka(X)). b) Je-li g všude klesající funkce, pak Ka(Y) = g(K1-a(X)). Důkaz: ad a) a = F(K a (X)) = P(X £ K a (X)) = P(g (X) £ g (K a (X))) = P(Y £ g (K a (X))) = F * (g (K a (X))) = g (K a (X)) = K a (Y) ad b) 1 - a = F(K1-a (X)) = P(X £ K1-a (X)) = P (g (X) > g(K^ (X))) = 1 - P(Y £ g (K^ (X))) = 1 - F * (g (K^ (X))) = g (K^ (X)) = K a (Y) _____Příklad: Nechť U ~ N(0, 1). Najděte 9. decil transformované náhodné veličiny Y = 3 + 2U. Řešení: Funkce y = 3 + 2u je všude rostoucí funkce, tedy K090(Y) = 3 + 2 u090 = 3 + 2 x 1,28155 = 5,5631. 332 Střední hodnota NV Definice: Nechť (W, A , P) je pravděpodobnostní prostor, X náhodná veličina aspoň intervalového typu definovaná na měřitelném prostoru (W, A ). a) Je-li X diskrétní náhodná veličina spravděpodobnostní funkcí p(x), pak její střední hodnota (vzhledem kP) je lo čísloE(x )= X xp(x ) pokud suma vpravo je konečná nebo absolutně konverguje. Jinak řekneme, že střední hodnota neexistuje. b) Je-li X spojitá náhodná veličina s hustotou pravděpodobnosti j(x), pak její střední hodnota (vzhledem k P) je číslo oo E(X )= jxj(x)dx, -00 neexistuje. pokud integrál vpravo je konečný nebo absolutně konverguje. Jinak řekneme, že střední hodnota (Střední hodnota je číslo, které charakterizuje polohu realizací náhodné veličiny na číselné ose spřihlédnutím kjejich pravděpodobnostem. V diskrétním případě představuje střední hodnota těžiště soustavy hmotných bodů, jejichž hmotnost je popsána pravděpodobnostní funkcí p(x) a ve spojitém případě je střední hodnota těžištěm hmotnépřímky, na nížje rozprostření hmoty popsáno hustotou pravděpodobnosti j(x). Střední hodnota je teoretickým protějškem váženého aritmetickéhoprůměru.) 00 333 Příklad Příklad a): Náhodnáveličina X udávápočet ok při hodu kostkou. Vypočtěte jejístředníhodnotu. Řešení: 6prox = 1> ... ,6, e (x )=£xp(x) = 6 (1 + 2 + 3 + 4 + 5 + 6 )= 7 = 3,5. [0 jinak x= 6 2 Příklad b): Rozložení náhodné veličiny X je dáno hustotou q>(x) = 2x+2 na (-1, 0) a nulovou jinde. Vypočtěte jejístředníhodnotu. Řešení E (X) = jxq>( x) dx = Jx(2 x + 2 )dx = -|0 ^ x 2 2 — + x2 3 j-1 33 334 R Střední hodnota transformované NV Věta: a) Diskrétni případ: Nechť X je diskrétní náhodná veličina s pravděpodob no s tni funkcí ir(x) (resp. ...Xn) je diskrétní náhodný vektor s pravde podobnostní funkcí w(xi.... .xn) ). Nechť g : B. h-> ií je borekrvská funkce, F = je transformovaná náhodná veličina (resp. g : B.n h-> B. je bore lovská fiinkce. Y — flfAi..... X.n) je transformovaná náhodná veličina). Pak E(V ) = ^ fff^J^f^A pokud součet vpravo je konečný nebo absolutné konver gentní (resp. E(Y) = g(x\j... . xn)n(x\. ...,xn), pokud součet vpravo je konečný nebo absolutné konvergentní). a) Spojitý případ: Nechť X je spojitá náhodná veličina s hustotou tp(x) (resp. (Xi, .... Xn) je spojitý náhodný vektor s hustotou tp(xi xn) ). Nechť g : i2 »-+ i2 je borelovská íunkce. ľ = g(Jf) je transformovaná náhodná veličina (resp. g : Rn i—> ič je borelovská funkce. 1 = g{X]..... X7l) je transformovaná náhodná veličina). Pak E(Y) = j g(x) 0 je konstanta. Vypočtěte E(Y). Řešení: j(x)=í1^-lxprox >0, E(Y)=)e^1e-1xdx: 1 (i iirmkr j [0jinak ' v 7 0 1 + g 336 Rozptyl NV Definice: Nechť (W, A , P) je pravděpodobnostní prostor, X náhodná veličina aspoň intervalového typu definovaná na měřitelném D(X) = E([X-E(X)]2), prostoru (w, A ), která má střední hodnotu E(X).Rozptylem náhodné veličiny X rozumíme číslo pokud střední hodnota vpravo existuje. Číslo Vd(X) se nazývá směrodatná odchylka. (Rozptyl je číslo, kterécharakterizuje proměnlivost realizacínáhodnéveličiny kolem jejístředníhodnoty spřihlédnutím kjejich pravděpodobnostem. Je teoretickým protějškem váženého rozptylu. Je vhodnější počítat rozptyl podle vzorce d(x )= e (x2 )- [e(x)]2 , jak bude ukázáno později.) Důsledek: V diskrétním případě je rozptyl dán vzorcem D(X)= £[x-E(X)] p(x)= Xx2p(x)-[E(X)] a ve D(X)= j[x -E(X)] j(x)dx = jx2 j(x) dx -[e(x)] (pokud suma či integrál vpravo absolutně konvergují). 337 Centrovanáa standardizovanáNV Definice: Transformovaná náhodná veličina X- E(X) se nazývá centrovaná náhodná veličin . X - E(X) Transformovaná náhodná veličina-— se nazývá standardizovaná náhodná veličina. Příklad: Náhodná veličina X udává počet ok při hodu kostkou. Vypočtěte její rozptyl. Řešení: p(x)= 6prox 1 E(X) = 3,5 (viz př. 12.10.), d(x)=^x2--3,52 [0 jinak x=1 35 12 2,92. 338 Kovariancea korelace NV ______Definice: Kovariancí náhodných veličin Xi. X2. které mají střední hodnoty E(Xi). E(X2). rozumíme číslo C(Xi. X2) = E([Xi - E(Xi)] [X2 - E(X2)]) (pokud střední hodnoty vpravo existují). Kovarianceje číslo. které charakterizuje proměnlivost realizací náhodných veličin Xi. X2 kolem jejich středních hodnot spřihlédnutím kjejich pravděpodobnostem. Je-li kovariance kladná (záporná), pak to svědčí o existenci jistého stupně přímé (nepřímé) lineární závislosti mezi realizacemi náhodných veličin Xi. X2. Je-li kovariance nulová, pak říkáme, že náhodné veličiny Xi. X2 jsou nekorelované a znamená to. že mezi jejich realizacemi není žádný lineární vztah. Pozor -z nekorelovanosti nevyplývá stochastická nezávislost, zatímco ze stochastické nezávislosti plyne nekorelovanost. Kovarianceje teoretickým protějškem vážené kovariance. Je vhodnější počítat kovarianci podle vzorce C(Xi.X2 )= E (XiX2)- E (Xi) E(X2) ■ Koeficientem korelace náhodných veličin Xi. X2 rozumíme číslo Xi -E(Xi) a X2 - E(X2)^ R(Xi. X2) VD(X2) pr^D(Xi^D(X2) > 0 pokud středníhodnoty vpravo existují. a/D(Xi) [0 jinak Koeficient korelace je číslo. které charakterizuje těsnost lineární závislosti realizací náhodných veličin Xi. X2. Čím bližšíje i. tím těsnějšíje přímá lineární závislost, čím bližší je - i. tím těsnějšíje nepřímá lineární závislost. Je vhodnější počítat koeficient korelace podle vzorce R (X X )= C(Xi.X2) 339 Kovariance NV Důsledek: V diskrétním případě je kovariance dána vzorcem C(X19X2 )= X3x, - E(X, )]-[x2 - E(X2 )]p(xl9x2 )=XS xix2p(x,,x2 )-e(xi ) e(x2 ) ¥¥ x1 =-¥ x2 =-¥ a ve spojitém případě vzorcem x1 =-¥ x2 =-¥ C(Xi,X2)= {j[xi -E(Xi)Hx2 -E(Xi)]j(xi,x2)dxidx2 = {{x^j(xi,x2)dxidx2 -E(Xi) E(X2) 340 Příklad ■ Příklad: Náhodná veličina X udává příjem manžela (v tisících dolarů) a náhodná veličina Y příjem manželky (v tisících dolarů. Je známa simultánní pravděpodobnostní funkce n(x,y) diskrétního náhodného vektoru (X,Y): 7i(10,10) = 0,2, n(10,20) = 0,04, 7i(10,30) = 0,01, 7i(10,40) = 0, 7i(20,10) = 0,1, n(20,20) = 0,36, n(20,30) = 0,09, 77(20,40) = 0, n(30,10) = 0, 77(30,20) = 0,05, 7i(30,30) = 0,1, 7(30,40) = 0, 7(40,10) = 0, n(40,20) = 0, 77(40,30) = 0, 77(40,40) = 0,05, n(x,y) = 0 jinak. Vypočtěte koeficient korelace příjmů manžela a manželky. Řešení: Náhodná veličina X i náhodná veličina Y nabývají hodnot 10, 20, 30, 40. Sestavíme kontingenční tabulku: X Y 10 20 30 40 p1(x). 10 0,20 0,04 0,01 0,00 0,25 20 0,10 0,36 0,09 0,00 0,55 30 0,00 0,05 0,10 0,00 0,15 40 0,00 0,00 0,00 0,05 0,05 p 2 (y) 0,30 0,45 0,20 0,05 1,00 Spočteme E(X) = 10.0,25+20.0,55+30.0,15+40.0,05 = 20, E(Y) = 10.0,30+20.0,45+30.0,20+40.0,05 = 20, D(X) = 102.0,25+202.0,55+302.0,15+402.0,05 - 202 = 60, D(Y) = 102.0,30+202.0,45+302.0,20+402.0,05 C(X,Y) = 10.10.0,20 + 10.20.0,04 + ... 40.40.0,05 - 20.20 = 49, R(X,Y) = 49/V60V70 = 0,76. 202 = 70, 341 Střední hodnota a rozptyl vybraných typů rozložení NV Poznámka: Uvedeme střední hodnoty a rozptyly vybraných typů diskrétních a spojitých rozložení: a) X ~ Dg(p) => E(X) = p, D(X) = 0 b) X ~ A( J ) => E(X) = J , D(X) = J (1-J ) c) X ~ Bi(n, J ) => E(X) = n J , D(X) = n J (1-J ) d) X ~ Ge( J ) E(X) = —, D(X) 1 J JJ 2 e) X ~ Hg(N,M,n) =» E(X) = Mn, D(X) = ^í 1 - M N N l N n -1 n2 -1 N-n N-1 f) X ~ Rd(G) E(X) = ^J., D(X) 12 g) X ~ Po(X) => E(X) = X, D(X) = X h) X ~ Rs(a, b) E(X) = 1+*, D(X) = i) X ~ Ex(X) => E(X) = I, D(X) = -l A A j) X ~ N(p, a2) => E(X) = p, D(X) = a2 k) X ~ x2(n) => E(X) = n, D(X) = 2n l) X ~ t(n) ^ E(X) = 0 pro n > 2, pro n = 1 E(X) neexistuje, D(X) = n pro n > 3, pro n = 1, 2 D(X) neexistuje n-2 m) X ~ F(n1, n2) => E(X) = — pro n2 > 3, pro n2 = 1, 2 E(X) neexistuje, D(X) = (n1 + "2—2^ pro n2 > 5, pro n2 = 1, n2 - 2 n1 (n2 - 2) (n2 - 4) 2, 3, 4 D(X) neexistuje. 342 Příklad Příklad: V sadě 15 výrobků je 5 zmetků. Náhodně vybereme 4 výrobky. Určete střední hodnotu a rozptyl náhodné vekičiny X, která udává počet zmetků, jestliže výběr provádíme a) bez vracení, b) s vracením. Řešení: ad a) X ~ Hg(N, M, n), N = 15, M = 5, n = 4 0,6984 ad b) X ~ Bi(n, J), n = 4, J = 343 Příklad Najděte medián rozložení určeného hustotou (p(x) = 1 - x/2, 0 < x <2. Rešení:Distribuční funkce: F(x) = 0 pro x < 0, F(x) = 1 pro x > 2 a F(x) = j1 - — dt = x - — pro x e (0,2) x2 4 Medián x05 je řešením rovnice F(x) = 0,5 , tedy x2 -4x + 2 = 0 => x. = 4^VI6r8 = 2±V2 =í3'4142 "1,2 2 0,5857 Protože 3,4142 > 2, je hledaným řešením x05 = 0,5857. F(x) 0,5 0,2 >X0,5 X0,5 344 x Příklad Náhodná veličina má hustotu j ( x) = a • e 'x ' x g (- ¥ , ¥ ) . Určete a, střední hodnotu a rozptyl. =y í2> i x ŕ/x I = — 2 Řešení: a E (X) = j*x j( x) /x = |x—e- x /x = 0 ¥ D (X ) = E (X2 )= Jx2- e- x|//x = 2 íľ E(X) 345 Příklad Nechť životnost (v letech) výrobků se řídí exponenciálním rozložením s distribuční funkcí F(x) = 1-e-x/5 , x >0. Tj. střední doba životnosti je 5 let. Tvar distribuční funkce znamená, že k poruše výrobku dojde s velkou pravděpodobností velmi brzy po jeho prodeji. Jakou záručnídobu stanovívýrobce, nemá-li počet reklamovaných výrobků překročit 10%? Řešení: Náhodná veličina X udává životnost výrobku. Hledáme takové x, aby platilo P(X £ x) = 0,1 Tedy hledáme 10% kvantil. ^=> 0,1 = 1 - e~x/5 x = -5 ln(0,9) = -5 • (-0,10536) = 0,5268 0123456789 10 Pro splnění požadované podmínky je třeba stanovit záruční dobu na cca V roku. 0.14 0.12 0.1 0.08 0.06 0.04 346 Příklad Nechť životnost (v letech) výrobků se řídí Weibullovým rozložením s distribuční funkcí F(x) = 1-e-(x/4)A5 , x >0. Tj. střední doba životnosti je cca 3.67 let. Tvar distribuční funkce znamená, že k poruše výrobku pravděpodobně nedojde hned po jeho prodeji, ale až po nějaké době. Jakou záruční dobu stanoví výrobce, nemá-li počet reklamovaných výrobků překročit 10%? Řešení: Náhodná veličina X udává životnost výrobku. Hledáme takové x, aby platilo P(X £ x) = 0,1 Tedy hledáme 10% kvantil. n ■ ■ A ■ ■ Pro splnění požadované podmínky je třeba stanovit záruční dobu na cca 2,5 roku. 347 Momenty, šikmost a špičatost NV Definice: Xediť A\ A i. X y jsou náhodné veličiny, Ar, k\ . A; 2 G R. r. w G AT. a) Číslo E([X — k\r) se nazývá t-tý ttifittierit náhodné veličiny X kolem konstanty k. Je li k = í). jde n r-tý porátaní nintrmnt. jj = 0. jde í í r xs-tý počáteční moment.je li a'1 = FT(A'i),fcy = /ľ(A'-^J, j^dnáseo rx,s-t.ý rentraliií itiťntit*ril.. Číslo Číslo A, (x )=4^ se nazývá šikmost náhodné veličiny X. se nazývá špičatost náhodné veličiny X. Je-li A3(X) = 0, jde o symetrické rozložení. Je-li A3(X) > 0, jde o kladně sešikmené rozložení a je-li A3(X) < 0, jde o záporně sešikmené rozložení. Je-li A4(X) = 0, jde o rozložení s normální špičatostí. Je-li A4(X) > 0, jde o špičaté rozložení a je-li A4(X) < 0, jde o ploché rozložení. 348 Vektor středních hodnot, variační a korelační matice náhodného vektoru Definice: \ediť X = (X|..... Xn)T je náhodný vektor. Pieálný vektor E{X) = (EiXx),... ,E(Xn)y se nazývá v*ktnr středních htirbint. Heálná čtvercová symetrická matice / D(Xt) C(X1}X2) ... C{Xt,Xn) var(X) = ... ......... \ c[xn,xt) c(xn,x2) ... mxn) se nazývá variaTířní nmtit^ náhodného vektoru X a reálná čtvercová syinet t irká matice / 1 R(XlfX2) ... R(X,..Xn) cor(X) = I _ ^ RiXn,^) R(Xn,X2) ... 1 se nazývá korelační tuh litre náhodného vektoru X. 349 Příklad Příklad: Pro náhodný vektor (X, Y) zpříkladu 12.19. najděte vektor středních hodnot, varianční a korelační matici. Řešení: Bylo spočteno, že E(X) = 20, E(Y) = 20, D(X) = 60, D(Y) = 70, C(X,Y) = 49, R(X,Y) = 0,76. E(X )= ' 20 ^ v 20 y , var1 (X )= '60 49A 49 70 cor (X )= 1 0,76 0,76 1 350 11. Vlastnosti číselných charakteristík NV ■ Věta: Nechť a, ai, a2, b, bi, b2 jsou reálná čísla, X, Xi, Xn, Yi, Ym jsou náhodné veličiny definované na témž pravděpodobnostním prostoru. Vnásledujících vzorcích vždy zexistence číselných charakteristik na pravéstraně vyplývá existence výrazu na levéstraně. Vlastnosti střední hodnoty a) E(a) = a b) E(a + bX) = a + bE(X) c) E(X - E(X)) = 0 f n ^ n d) E XXi = XE(Xi) V i=1 J i=1 11 11 e) Jsou-li náhodné veličiny X1, Xn stochasticky nezávislé, pak E nxi = nE(xi) V i=1 J i=1 351 Vlastnosti číselných charakteristik NV - kovariance Vlastnosti kovariance a) C(ai, X2) = C(Xi. a2) = C(ai, a2) = 0 b) C(ai + biXi. a2 + b2X2) = bib2C(Xi. X2) c) C(X. X) = D(X) d) C(Xi, X2) = C(X2, Xi) e) C(Xi, X2) = E(XiX2) - E(Xi)E(X2) n m j nm f) C E Xi, E Yj = EEc(Xí.Yj) 352 Vlastnosti číselných charakteristik NV - rozptyl Vlastnosti rozptylu a) D(a) = 0 b) D(a + bX) = b2D(X) c) D(X) = E(X2) - [e(X)]2 í n A n n-1 n í n ^ d)D XXi = ^D(Xi) + 2Hc(Xi,Xj) (jsou-li náhodné veličiny X1, Xn nekorelované, pak D XXi V i=1 0 i = 1 i=1 j=i+1 V i=1 0 X D(Xi)) i=1 353 Vlastnosti číselných charakteristik NV - korelace Vlastnosti koeficientu korelace a) R(a1, X2) = R(X1, a2) = R(ab a2) = 0 b) R(a1 + b1X1, a2 + b2X2) = sgn(b1b2) R(X1, X2) c) R(X, X) = 1 pro D(X) í 0, R(X, X) = 0 jinak d) R(X1, X2) = R(X2, X1) e) R(X1, X2) JE(X1 ,XiL_ pro VD(X1) VD(X2) > 0 [0 jinak 354 Vlastnosti střední hodnoty - důkaz Důkaz: Pro vlastnosti střední hodnoty ad a) X ~ Dg(a), p(x)= i1pro x = a, E(X)= Jxp(x)= ap(a)= a • 1 = a [0 jinak x=-¥ ¥ ¥ ¥ ¥ ¥ ad b) Diskrétnípřípad: E(a + bX)= J (a + bxMx)= J ap(x)+ J bxp(x)= a Jp(x)+ b J xp(x)= a + bE(x) ¥ ¥ ¥ Spojitýpřípad: E (a + bX) = J(a + bx j(x )dx = a j j (x )dx + b Jx j(x )dx = a + bE (X) -¥ -¥ -¥ ad c) Plyne z (b), kde a = -E(X), b = 1. ÍYl \ ¥ ¥ J X, ] = J- Jfo + k + x ,=1 y -¥ -¥ ¥¥ ¥¥ J* * * Jx1j (x1, * * *, xn ) dx1 * * * dxn + * * * + J* * * Jxn j (x1, * * *, xn ) * * * dxn -¥-¥ ¥ f ¥ ¥ ¥-¥ ¥ ¥ ¥ _ -¥ -¥-¥-¥ ¥ ¥-¥ = Jx1j1 (x1 )dx1 + *" + Jxnjn (xn )dxCn = E(xX1 )+ *" + E (X n )= J E(Xí ) -¥ -¥ Í = 1 dx n-1 dxn= _n 355 ¥ Vlastnosti střední hodnoty - důkaz ad d) Diskrétnípřípad: analogicky jako ve spojitém případě. ad e) Spojitý případ: / n \ ¥ ¥ i=1 — ¥ —¥ ¥¥ = J(x1 * — * Xn MX1 )* — * j(xn )dX1 " dXn = —¥—¥ ¥ = JX1j(x1 )dX1 * — * JXnj((Xn )dXn = ¥ n =n e (x, ) i=1 ad e)Diskrétnípřípad: analogicky jako ve spojitém případě. 356 ¥ Vlastnosti kovariance - důkaz Pro vlastnost i kovarianc e: ad a) C(a1,X2) = E ([a, - E(a, )][X2 - E (X2)]) = E ([a, - a, ][X2 - E (X2)]) = E(0) = 0 ad b) C(a1 + b1X1,a2 + b2X2 )= E([a1 + b1X1 -(a1 + b1E(X1 ))][a2 + b2X2 -(a2 + b2E(X2 ))])= b1b2E([X1 - E(X1 )][X2 - E(X2 )]) = b1b2C(X1,X2) ad c) c(x, x ) = e ([x - e(x )][x - e (x )])=e ([x - e (x )]2) = d(x ) ad d) C(X1,X2 )=e ([X1 - e (X1 )][X2 - e (X2 )])=e([x2 - e (X2 )][X1 - e(X1 )])=cfe^) ad e) C(X1,X2 ) = E([X1 - E(X1 )][X2 - E(X2 )]) = E(X1X2 - X2E(X1)-X1E(X2) + E(X1 )E(X2 )) = E(X1X2)-E(X2X1)-E(X1 )E(X2)+ E(X1 )E(X2 ) = = E (X1X2)-E (X1 )E (X2) ad f) f n m ^ f n f n > - m f m > f C IXi> IYj =E - E IX Iyj- E I Yj = E Vi=1 H 0 V _ i=1 V i=1 0 - _ j=1 V j=1 0 - 0 V I [Xi - E (Xi )É [Yj - E (Y.)] I = II [Xi - E (Xi - E (y.)] = j=1 i=1 j=1 nm = IIC(Xi,Yj) i=1 j=1 357 Vlastnosti rozptylu - důkaz Pro vlastnosti rozptylu ad a) ad b) - a - D (a) = E ([a - E (a) ]2) = E ([a - a ]2) = E (0) = 0 D (a + bX) = E ([a + bX - E (a + bX) ]2 )= E ([a + bX = E (b2 [X - E (X ) ]2) = b2 D (X) ad c) D (X ) = E ([X - E (X ) ]2) = E (x 2 - 2 XE (X ) + [E (X ) ]2)= = E (X2)- 2 E (X )E (X)+ [E (X ) ]2 = E (x 2)- [E (X ) ]2 ad d) Dl I X,] = C I X,, IX j = C (Xp X1)+ C (X p x2)+... + C (Xp Xn)+... + + C (Xn , X1 )+ C (Xn , X 2 )+ k C (Xn , Xn ) = bE(X)]2)= nn =1j=1 n-1 n = Id (x, )+2IIC (x , Xj) =1 =1j= +1 358 Vlastnosti korelace - důkaz Pro vlastnosti koeficientu korelace: ad a) Plyne přímo z definice, protože D(ai) = D(a2) = 0, í ad b) R(ai + biXi.a2 + b2X2) = E ai + bi Xi - E (ai + bi Xi) a2 + b2 X2 - E (a2 + b2 X2) V VD (ai + bi Xi) (a 2 + b2 X2) 0 a + bi Xi - ai - bi E (Xi) a2 + b2 Xi - a2 - b2 E (X2) V bi2D(Xi) b22D(X2) Mu2 0 h.. h. r (xi, X 2 ) = sgn (bi • b2 )R (Xi, X 2) 359 Vlastnosti korelace - důkaz ad c) Pro D(X) = 0 plyne přímo z definice, jinak platí r (x, x ) = e x - e (x ) x - e (x ) 1 d ( x ) e ([x - e (x) ]2) = —^- d (x) = 1 d(x) ad d) Zřejmé. í ad e) r (x1, x2) = e xx - e(x ) x2 - e(x2) V 0 4d ( x1) Vd ( x 2) = e ([x1 - e (x1 2 - e (x2)]) = c(xp x2) 4 d ( x1) ^ d ( x 2) Vd ( x1) -V d ( x2) 360 Příklad Příklad: Vypočtěte střední hodnotu a rozptyl a) centrované náhodné veličiny Y = X b) standardizované náhodné veličiny u = Řešení: ad a) E(Y) = E(X ad b) E(U) E(X), X - E(X) VD(X) E(X-m) s E(X) - = -E(X s E(^) - Ji) = s - jí = 0, D(Y) = D(X 0 = 0, D(U) D(X-m) s D1(X) = s a2, 1 2 • a 1. Příklad: Náhodné veličiny X, Z jsou náhodné chyby, které vznikají na vstupním zařízení. Mají střední hodnoty E(X) = -2, E(Y) = 4 a rozptyly D(X) = 4, D(Y) = 9. Koeficient korelace těchto chyb je R(X,Y) = -0,5. Chyba na výstupu zařízení souvisí 2 2 s chybami na vstupu funkční závislostí Z = 3X - 2XY + Y - 3. Najděte střední hodnotu chyby na výstupu. Řešení: E(Z) = E(3X2 - 2XY + Y2 - 3) = 3E(X2) - 2E(XY) + E(Y2) - E(3) = 3{D(X) + [E(X)]2} - 2[C(X,Y) + E(X)E(Y)] + D(Y) + [E(Y)]2 - 3 = 3[D(X) + [E(X)]2] - 2[R(X,Y) VD(X)VD(Y) + E(X)E(Y)] + D(Y) + [E(Y)]2 - 3 = 3(4 + 4) -2[-0,5 x 2 x 3 + (-2) x 4] + 9 + 16 - 3 = 24 + 22 + 25 - 3 = 68 361 Příklad Náhodná veličina X udává počet ok při hodu kostkou. NV Y = 2+ 3X. Vypočtěte: a) E(X) a D(X). b) E(Y) a D(Y). c) C(X.Y). d) R(X.Y). Řešení: a) E(X) = - £ x = 3.5 D(X) = - £ x2 - E(X)2 = — - 3.52 = 2.9i67 6 x=i 6 x=i 6 b) E (Y) = E (2 + 3 X) = 2 + 3E (X) = 2 + 3 • 3.5 = i2.5 D (Y) = D (2 + 3 X) = 32 D (X) = 9 • 2.9i67 = 26.25 c) C(X. Y) = C(X.2 + 3X) = 3C(X. X) = 3D(X) = 3 • 2.9i67 = 8.750i d) R(X. Y) = R(X.2 + 3X) = sgn(3)R(X.X) = i •i = i 362 Příklad Náhodná veličina X udává součet počtu ok při hodu 2 kostkami. Vypočtěte E(X). Řešení: Xi ... počet ok při i-tém hodu, i = 1,.. .,6 Nebo: E (X) = 3,5 r 2 E (X) = E ^ Z X = £ E(X, )=£ 3,5 = 7 V i=1 0 i=1 =1 součet počet možností možnosti 2 1 11 3 2 12 21 4 3 22 13 31 5 4 23 32 41 14 6 5 33 24 42 51 15 7 6 34 43 25 52 16 61 8 5 44 35 53 26 62 9 4 54 45 36 63 10 3 55 64 46 11 256 65 121 66 Celkem 36 12 E ( X ) = Z xp( X ) X = 2 36 (2-1 + 3 • 2 + 4 • 3 + 5 • 4 + 6 • 5 + 7 • 6 + 8 • 5 + 9 • 4 +10 • 3 +11 • 2 +12-1) 252 1$6~ 7 1 363 Markovova nerovnost Věta (Markovova nerovnost): Nechť pro náhodnou veličinu X se střední hodnotou E(X) platí P(X > 0) = 1. Pak platí Markovova nerovnost: p(x >se(x))< - Ilustrace pro spojitý případ: EIXj EE(X) Důkaz: Pro spojitý případ: E(X) = jxj(x)dx > jx jsE(X)cp(x)dx 0 sE (X ) sE (X ) => P (X > s E (X ))<1 s E (X) jj(x )dx = s E (X)) (( > s E (X)) sE(X) 364 Příklad Příklad: Nechť P(X >0) = 1a E(X) = 8, kde 8 > 0 je konstanta. a) Odhadněte p(x > 35). b) Nechť X ~ Exl1I. Vypočtěte P(x > 35). Řešení: ad a) p(x > 35)< 3 = 0,3 ad b) X ~ Exl - I => j(x) v"0 -e 5prox> 0, )=5,p(x > 35)= J-[Ojinak 35 e 5 dx e-3 = 0,04975 35 365 L Věta (Čebyševova nerovnost): Nechť náhodná veličina X má střední hodnotu E(X) a rozptyl D(X). Pak platí Čebyševova nerovnost: Vt > 0: p(X - E(X) > tVD(X)) < ^ • Ilustrace pro spojitý případ Důkaz: Pro spojitý případ: Plyne z Markovovy nerovnosti, kde položíme Y = [X - e(x )]2. Pak P (y > 0) = 1 a pro Ve > 0: P(Y > sE(Y)) <1, tj. pro Ve > 0: p([x - e(x)]2 > eE([X - e(x)]2)) <1. Položme e = t2. Po odmocnění máme e e vt > 0:p( x - e(x )> tVD(X) )< -L 366 Příklad Příklad: Nechť E(X) = D(X) = a2. a) Odhadněte P (X - n| > 3a). b) Jestliže X ~ N(u, a2), vypočtěte P (X - ^ > 3a). Řešení: ad a) P (X -m> 3a) < 3L = I = 0,1. (Tomuto výsledku se říká pravidlo 3 a a říká, že nejvýše 11,1% realizací náhodné veličiny leží vně intervalu (p - 3a, p + 3a).) ad b) P (X - d > 3a) = 1 - P(-3a < X - p < 3a) = 1 - P(-3 < < 3) = 1 - 0(3) + 0(-3) = 2[1 - 0(3)] = 2(1 - 0,99865) a 0,0027. (Má-li náhodná veličina normální rozložení, pak pouze 0,27% realizací leží vně intervalu (p - 3a, p + 3a).) 367 Cauchy - Schwarzova - Buňakovského nerovnost Věta (Cauchyova - Schwarzova - Buňakovského nerovnost): Nechť R(X1? X2) je koeficient korelace náhodných veličin X1? X2. Pak |R(X1?X2)| £ 1 a rovnost nastane tehdy a jen tehdy, když mezi veličinami X1, X2 existuje s pravděpodobností 1 úplná lineární závislost, tj. existují konstanty a, b tak, že P(X2 = a + bXO = 1. Důkaz: Zavedeme standardizované náhodné veličiny Ui = i/_ , i 1, 2. 0 £ D(U1 ± U2 ) = D(U1 )± 2C(U1,U2)+ D(U2 )= 2[1 ± R (X1,X2 )]^ |R (X1,X2 )< 1. Předpokládejme nejprve, že R(X1, X2) = 1. V tomto případě počítáme d(u1 - U2) = 2[1 - R(X1,X2)] = 0. To je možné jen tak, že P (U1 = U2 ) = 1,tj.P(U 1 U2 = 0) = 1, tj. 1 = P =P X2 = E (X2 )- E(X1)+ X1 tudíž a = E(X2 )-^ E (X1), b = ^. Předpokládáme-li, že R(X1, X2) = -1, pak počítáme d(u1 + U2). Nechť naopak P(X2 = a + bX1 ) = 1. Pak R(X1,X2) = R(X1,a + bX1 ) = sgn(b)R(X1,X1 ) = sgn(b) = j1 pro b > 0 [-1 pro b < 0 368 12. Slabý zákon velkých čísel a centrálni limitní věta S rostoucím počtem opakovaných nezávislých pokusu, zjištujeme. že empirické charakteristiky, které popisují výsledky těchto pokusů, se blíží teoretickým charakteristikám. Například relativní četnost úspěchu se blíží pravděpodobnosti úspěchu; průměr měření zatížených náhodnou chybou se blíží hledaně neznámé střední hodnotě; empirická distribuční funkce se blíží distribuční funkci. Těmito skutečnostmi se zabývá Slabý zákon velkých čísel, specifikovaný např. Cebyševovou větou, nebo Bernoulliovou větou. Podstatou centrální limitní věty je tvrzení, že náhodná veličina X. která vznikla jako součet velkého poctu vzájemně nezávislých náhodných veličin Xi>X2.....Xn má za velmi obecných podmínek přibližně normální rozdělení. Nej jednodušší specifikací centrální limitní věty je Moivre-Laplaceova věta. Zobecněním Moivre-Laplaceovy věty je věta Lindbergova-Lévyova. Nejobecněji centrální limitní větu formuloval Ljapunov, jeho větu vsak nebudeme uvádět. V současné době, kdy databáze mají ohromné množství položek, je aplikace CIA nesmírně užitečná. Při uvedení zmíněných vět se neobejdeme bez pojmu konvergence posloupnosti náhodných veličín. V počtu pravděpodobnosti se nabízí řada způsobů, jak konvergenci posloupnosti náhodných veličin definovat, my si uvedeme následující tři. 369 Typy konvergence posloupnosti NV Definice: Říkáme, že náhodná posloupnost {X\. Aľ3>. . . , Xn,...) konverguje k náhodné veličině X (i*) jistě, právě když všechny realizace náhodné posloupnosti (Xi(íj)j A^f^1),. .. , An(ůj)5...) konvergují k realizaci náhodné veličiny AT(l^). Tedy platí: Vw e Q : lim XJu) = X(u) [Jedná se o ,? obyčejnou" konvergenci číselné posloupnosti] (iL) podle pravděpodobnosti^ právě když pro každé e > 0 platí: lim P(|Xn-X| . .., Xn,...) může konvergovat i ke konstantě, což je v předchozí definici zahrnuto. Stačí uvažovat náhodnou veličinu X degenerovanou. Věta: Nechť (Xjj X2.....Xn. , , ,) je náhodná posloupnost, 1. Jestliže tato náhodná posloupnost konverguje k náh. vel. X jistě, pak k ní nutně konverguje i podle pravděpodobnosti. Konverguje-li k X podle pravděpodobnosti, pak k ní nutně konverguje i v distribuci. [Obrácené implikace obecně neplatí. 2. K tomu, aby náhodná posloupnost [X\. X2i..., Xn,...) konvergovala podle pravděpodobnosti k číslu fi, stačí splnění po dmi nok lim E(Xn) = // A lim D(Xn) = 0 371 Slabý zákon velkých čísel Cebyševovavěta Věta: Cebyševova Nechť náhodná posloupnost (X.....Xn,...) je posloupnost stochasticky nezávislých a stejně rozložených náhodných veličin se stejnou střední hodnotou fi a stejným rozpty- . 2 n lem 0 platí: P(|-f>WIl-4? neboli M&n£x;*«-/'ivV vr.vi Nechť náhodná veličina Yn udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, kdy úspěch nastává v každém pokusu s pravděpodobností tf, 0 < ů < 1. Pak posloupnost relativních četností (Yx, -k,... ^...) konverguje podle pravděpodobnosti k pravděpodobnosti úspěchu tf. Tedy pro každé e > 0 platí: neboli P(ř-,ii-^ lim -Ů\ 0 platí: P(|^ - ů\ < f) > 1 - ^P-. ±euy i \ \ 3000 3000| *> UjUlj ^ 1 30000.01* uiQU Pokud bychom chtěli využít přímo Cebysevovu větu, pak bychom za Xt volili náhodnou veličinu s alternativním rozložením, kde jednička symbolizuje vyrobení zmetku (úspěch) a nula wTobeni kvalitního výrobku. T«ty^~4(^),ri = l,...f3000 = iäi W=ä(1-ä)i^--ľ^ jsou stoclr. nezávislé. Dále stačí za f volit 0,01 a dosadit do Cebysevovy věty. (Uvědomte si, že binomická náhodná veličina vzniká jako součet nezávislých, stejné rozložených alter- 274 nativních náhodných veličin.) Centrální limitnívěta Věta: Lindbergova-Lévyova v. . r h i ^mun v,ía. Nedlí náliodná posloupnost (XL,..., Arn_ . .) je posloupnost stochasticky nezávislých a stejně rozložených náhodných veličin se stejnou střední hodnotou {.i a stejným rozptylem h g1. Uvažme součet X = Y Xt a odvoďme střední hodnotu a rozptvl nové náhodné veli- 1=1 činy X. E(X) = E(t X,) = £ E(Xt) =lfi = n/i 1=1 TI 1=1 TI 1=1 n D{X) = D(E Xt) = £ D{Xi) = E o"2 - na2 t-i Nyní uvažme standardizovaný součet Í7n = ^^-j = 1-8 — Ln m^eme libovolně zvětšovat] Potom náhodná posloupnost standardizovaných součtů (t/i: f/2: - . - , í/n- - ■) konverguje v distribuci k náhodné veličině U ^ N(0A). Tedy Vti /u 1 € R : lim PÍUn )n_í ... náročná sumace Aproximace normálním rozložením: p(y; 9 A -rr<í?<-r7. 376 Příklad V určité skupině zaměstnanců je 10% spříjmem, který překračuje celostátní průměr. Kolik zaměstnanců z této skupiny je třeba vybrat, aby s pravděpodobností aspoň 0,95 bylo mezi nimi 8% až 12% zaměstnanců s nadprůměrným příjmem? Řešení: X - počet zaměstnanců s nadprůměrným příjmem, X ~ Bi(n, 0,1), E(X) = 0,1n, D(X) = 0,09n, 0,95 < P f X >] 0,08 < — £ 0,12 n P(0,08n < X < 0,12n) = P f 0,08n - 0,1n X - 0,1n 0,12n - 0,1n^ ■\fň X - 0,1n Vn £ £ 15 £ £ tedy-> u 15 V0,09n 15 0975 = 1,96 = Vň > 29,4 == n > 865. f m V n -F f = 2F f m V n -1 => F f m V n - l 15 0 15 0 l 15 0 115 0 V0,09n V0,09n V0,09 n > 0,975, 377 Příklad 100-krát nezávisle na sobe házíme kostkou. Jaká je pravděpodobnost, že šestka padne aspoň Označme y10Q náhodnou veličinu, udávající počet padnutých šestek ve 100 hodech, nů{l -1?) = 100 • 1 - ±) = ^ > 9 A ^ < l < jjjj, tedy obě podmínky jsou splněny. Hledanou pravděpodobnost odhadneme pomocí Moivre-Laplaceovy věty. 1 - P{Un < 0, 626) & 1 - $(07 626) = 1 -0,73565 = 0,2635. (Přesný výpočet pomocí softwaru by vysel 0.2198.) Aproximace binomického rozložení normálním rozložením nemusí být vždy nejvhodnější. Pro extrémně malé pravděpodobnosti úspěchu i? užíváme přibližný vzorec, který vychází z Poissonovy věty. 20-krát? Řešení: PÍV'ioo > 20) = 1 - PfVioo < 20) = P(Y1Q0 < 19) = 1 378 Věta: Poissonova Nechť y1} Y2.... je posloupnost stochasticky nezávislých náhodných veličin, Yn ™ n = L 2.... a platí lim nůn = A. Pak posloupnost yj. Y2l... 1^,... konverguje v distribuci k náhodné veličině l7 ™ Po(A). tedy Fa Po(X). [Náhodná veličina Y má Poissonovo rozložení s parametrem A. náhodnou veličinu } „ s binomickým rozložením lze aproximovat Poissonovýn rozložením. 379 Příklad Poznámka: Na základě Poissonovy věty se používá přibližný vzorec, který nahrazuje pracný výpočet distribuční (resp. pravděpodobnostní) funkce binomického rozložení jednoduchým hledáním v tabulkách distribuční (resp. pravděpodobnostní) fiinkt ^ Poissonova rozložení. •P(Yn < 2/) = £ ("J^t1 ~ *)n_l w F^(y) ~ Po(nŮ), kde Fn^(y) je distribuční funkce Poissonova rozložení s parametrem X — nů mP(Yn — y) — — $}ny & e~n^ (Srovnej s pravděpodobnostní funkcí Poisso- nova rozložení, která je tabelovaná.) Aproximaci je vhodné použít, pokud jsou splněny následující podmínky: n > 30 At9 < 0,1 380 Příklad Během zkoušky spolehlivosti se přístroj porouchá s pravděpodobností 0,05. Jaká je pravděpodobnost, že při zkoušení 100 přístrojů se jich porouchá právě 5? Řešení: Označme V100 náhodnou veličinu, udávající počet porouchaných přístrojů ve 100 zkouškách, Víro ~B£( 100; 0,05). Nejdříve ověříme podmínky pro použití aproximace Poissonovým rozložením: 100 > 30 A 0.05 < 0.1, Určení hledané pravděpodobnosti aproximací Poissonovým rozložením: ^(^íoo — 5) ft< (iofro,5) e-ioo-o.c^ CQ- nemusíme počítat, jelikož jde o pravdě podobnostní funkci Poissonova rozložení v bodě 5 s parametrem A = 100 ■ 0,05, která je v tabulkách. Tedy p5(5) = 0,17547 Určení hledané pravděpodobnosti přesným výpočtem: P(Vioo = 5) = ('f )0.055(1 - 0.05)a5 = ...=0.18 381 13. Statistické tabulky Následující tabulky obsahují hodnoty: > Pravděpodobnostní funkce Binomického rozložení > Pravděpodobnostní funkce Poissonova rozložení > Distribuční funkce standardizivaného normálního rozložení > Kvantilů standardizivaného normálního rozložení > Kvantilů rozložení %2 rozložení > Kvantilů Studentova rozložení > Kvantilů Fisherova-Snedecorova rozložení 382 Pravděpodobnostní funkce binomického rozložení Bi(n,p) 1. část p 11 x .01 .05 .10 .15 .20 .25 .30 1/3 .35 .40 .45 .49 .50 2 0 .9801 .9025 .8100 .7225 .6400 .5625 .4900 .4444 .4225 .3600 .3025 .2601 .2500 1 .0198 0950 .1800 .2550 .3200 .3750 .4200 .4444 .4550 .4800 .4950 .4998 .5000 2 0001 .0225 .0100 .0225 .0400 0625 .0900 .1111 .1225 .1600 .2025 .2401 .2500 3 0 .9703 .8574 .7290 .6141 .5120 .4219 .3430 .2963 .2746 .2160 .1664 .1327 .1250 1 .0294 .1354 .2430 .3251 .3840 .4219 .4410 .4444 .4436 .4320 .4084 .3823 .3750 2 .0003 .0071 .0270 .0574 0960 .1406 .1850 .2222 .2389 .2880 .3341 .3674 .3750 3 .0000 0001 .0010 .0034 .0080 .0156 .0270 .0370 0429 .0640 .0911 .1176 .1250 4 0 9606 .8145 .6561 .5220 .4096 .3164 .2401 .1975 .1785 .1296 .0915 .0677 .0625 1 0388 .1715 .2916 .3685 .4096 .4219 .4116 .1951 .3845 .3456 .2995 .2600 .2500 2 .0006 .0135 .0486 .0975 .1536 .2109 .2646 2963 .3105 .3456 .3675 .3747 .3750 3 0000 0005 .0036 .0115 .0256 0469 .0756 0988 .1125 .1536 .2005 .2400 .2500 4 0000 0000 0001 0005 0016 0039 .0081 .0123 .0150 .0256 .0410 .0576 .0625 5 0 .9510 .7738 .5905 .4437 .3277 .2373 .1681 .1317 .1160 .0778 .0503 .0345 .0312 1 .0480 .2036 .3280 .3915 .4096 .3955 .3602 .3292 .3124 .2592 .2059 .1657 .1562 2 0010 .0214 .0729 .1382 .2048 .2637 .3087 .3292 .3364 .3456 .3369 .3185 .3125 3 0000 .0011 .0081 .0j44 .0512 .0879 .1323 1646 .1811 .2304 .2757 .3060 .3125 4 .0000 .0000 .0004 .0022 .0064 .0146 .0284 .0412 .0488 .0768 .1128 .1470 .1562 5 .0000 .0000 .0000 .0001 .0003 .0010 .0024 .0041 .0053 .0102 .0185 .0283 .0312 383 Pravděpodobnostní funkce binomického rozložení Bi(n,p) 2. část 1 P 6 0 9415 .7351 .5314 .3771 .2621 .1780 .1176 .0878 .0754 .0467 .0277 .0176 .0156 1 .0571 .2321 .3543 .3993 .3932 3560 .3025 .2634 .2437 .1866 .1359 .1014 .0938 2 .0014 .0305 0984 .1762 .2458 2966 .3241 .3292 3280 .3110 .2780 .2437 .2344 3 0000 .0021 .0146 .0425 0819 .1318 .1852 .2195 .2355 .2765 .3032 .3121 .3125 4 0000 .0001 .0012 .0055 .0154 .0330 .0595 .0823 .0951 .1382 .1861 .2249 .2344 5 .0000 .0000 .0001 .0004 0015 .0044 .0102 .0165 .0205 .0369 .0609 .0864 .0938 6 .0000 .0000 .0000 .0000 .0001 .0002 .0007 .0014 0018 .0041 .0083 .0139 .0156 7 0 .9321 .6983 .4783 .3206 .2097 .1335 0824 .0585 .0490 .0280 .0152 .0090 .0078 1 .0659 .2573 .3720 .3960 .3670 .3115 .2471 .2048 .1848 .1306 .0872 .0603 .0547 2 .0020 .0406 .1240 .2097 .2753 .3115 .3171 .3073 .2985 .2613 .2140 .1740 .1641 3 0000 .0036 .0230 .0617 .1147 .1730 .2269 .2561 .2679 .2903 .2918 .2786 .2734 4 .0000 .0002 .0026 .0109 .0287 .0577 .0972 .1280 .1442 .1935 .2388 26~6 .2734 5 .0000 .0000 .0002 .0012 .0043 .0115 .0250 .0384 0466 .0774 .1172 .1543 .1641 6 .0000 .0000 .0000 .0001 .0004 .0013 .0036 .0064 .0084 .0172 .0320 .0494 .0547 7 0000 0000 0000 0000 0000 .0001 .0002 0005 0006 .0016 .0037 .0068 .0078 8 0 .9227 .6634 .4305 .2725 .1678 .1001 .0576 .0390 .0319 0168 .0084 .0046 .0039 1 .0746 .2793 .3326 .3847 .3355 .2670 .1977 .1561 .1373 .0896 0548 .0352 .0312 2 .0026 .0515 .1488 .2376 2936 .3115 2965 .2731 .2587 .2090 .1569 .1183 .1094 3 .0001 .0054 .0331 .0839 .1468 .2076 .2541 .2731 .2786 .2787 .2568 .2273 .2188 4 .0000 .0004 .0046 .0185 0459 .0865 1361 .1707 .1375 .2322 .2627 .2730 .2734 5 .0000 .0000 .0004 .0026 .0092 .0231 .0467 .0683 .0803 .1239 .1719 .2098 .2188 6 .0000 .0000 .0000 .0002 .0011 .0038 .0100 .0171 .0217 .0413 .0703 .1008 .1094 7 .0000 .0000 .0000 .0000 .0001 .0004 .0012 .0024 .0033 .0079 .0164 .0277 .0312 8 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0002 .0002 .0007 .0017 .0033 .0039 384 Pravděpodobnostní funkce binomického rozložení Bi(n,p) 3. část p 9 0 .9135 .6302 .3874 .2316 .1342 .0751 .0404 .0260 .0207 .0101 .0046 .0023 .0020 1 .0830 .2985 .3874 .3679 .3020 .2253 .1556 .1171 .1004 .0605 .0339 .0202 .0176 2 .0034 .0629 .1722 .2597 .3020 .3003 .2668 .2341 .2162 .1612 .1110 .0776 .0703 3 .0001 .0077 .0446 .1069 .1762 .2336 .2668 .2731 .2716 .2508 .2119 .1739 .1641 4 .0000 0006 .0074 .0283 0661 1168 .1715 .2048 .2194 .2508 .2600 .2506 .2461 5 .0000 .0000 .0008 .0050 .016:' 0389 .0735 .1024 .1181 .1672 .2128 .2408 .2461 6 .0000 .0000 .0001 .0006 .0028 .0087 .0210 .0341 .0424 .0743 .1160 .1542 .1641 7 .0000 .0000 .0000 .0000 .0003 .0012 0039 .0073 0098 .0212 .0407 .0635 .0703 8 .0000 .0000 .0000 .0000 .0000 .0001 0004 .0009 .0013 .0035 .0083 Q153 .0176 9 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0001 .0003 .0008 .0016 .0020 10 0 .9044 .5987 .3487 .1969 .1074 .0563 .0282 .0173 .0135 .0060 .0025 .0012 .0010 1 .0914 .3151 .3874 .3474 2684 .1877 .1211 .0867 .0725 .0403 .0207 .0114 .0098 2 .0042 .0746 .1937 .2759 .3020 .2816 .2335 .1951 .1757 .1209 .0763 .0495 .0439 3 .0001 .0105 .0574 .1298 .2013 .2503 .2668 .2601 .2522 .2150 .1665 .1267 .1172 4 .0000 .010 .0112 .0401 .0881 .1460 .2001 .2276 .2377 .2508 .2384 .2130 .2051 5 .0000 .0001 .0015 .0085 0264 .0584 .1029 1366 .1536 .2007 .2340 .2456 .2461 6 .0000 .0000 .0001 .0012 .0055 .016: 0368 .0569 .0689 .1115 .1596 .1966 .2051 7 .0000 .0000 .0000 .0001 .0008 .0031 0090 .0163 .0212 .0425 .0746 .1080 .1172 8 .0000 .0000 .0000 .0000 .0001 0004 0014 .0030 .0043 .0106 .0229 .0389 .0439 9 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .0005 .0016 .0042 .0083 .0098 10 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0001 .0003 .0008 .0010 385 Pravděpodobnostní funkce Poissonova rozložení Po(X) 1. část X x 0.1 0,2 03 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0 0.9048 8187 7408 6703 6065 5488 4966 4493 4066 3679 1 0905 1637 2222 2681 3033 3293 3476 3595 3659 3679 2 0045 0164 0333 0536 0758 0988 1217 1438 1647 1839 3 0002 0011 0033 0072 0126 0198 0284 03 & 3 0494 0613 4 0000 0001 0003 0007 0016 0030 0050 0077 0111 0153 5 0000 0000 0000 0001 0002 0004 0007 0012 0020 0031 6 0000 0000 0000 0000 0000 0000 0001 0002 0003 0005 7 0000 0000 0000 0000 0000 0000 0000 0000 0000 0001 x 1.1 1,2 1,3 1.4 1,5 1.6 1,7 1:8 1.9 2,0 0 0,3329 3012 2725 2466 2231 2019 1827 1653 1496 1353 1 3662 3614 3543 3452 3347 3230 3106 2975 2842 2707 2 2014 2169 2303 2417 2510 2584 2640 2678 2700 2707 3 0738 0867 0998 1128 1255 1378 1496 1607 1710 1804 4 0203 0260 0324 0395 0471 0551 0636 0723 0812 0902 5 0045 0062 0084 0111 0141 017o 0216 0260 0309 0361 6 0008 0012 0018 0026 0035 0047 0061 0078 0098 0120 7 0001 0002 0003 0005 0008 0011 0015 0020 0027 0034 8 0000 0000 0001 0001 0001 0002 0003 0005 0006 0009 9 0000 0000 0000 0000 0000 0000 0001 0001 0001 0002 386 Pravděpodobnostní funkce Poissonova rozložení Po(k) 2. část X 3.0 4,0 6.0 7,0 8.0 9.0 10,0 ILO 12,0 0 0;0498 Ol 83 0067 0025 0009 0003 0001 0000 0000 0000 1 1494 0733 0337 0149 0064 0027 0011 0005 0002 0001 2 2240 1465 0842 0446 0223 0107 0050 0023 0010 0004 3 2240 1954 1404 0892 0521 0286 0150 0076 0037 0018 4 1680 1954 1755 1339 0912 0573 0337 0189 0102 0053 5 1008 1563 1755 1606 1277 0916 0607 0378 0224 0127 6 0504 1042 1462 1606 1490 1221 0911 0631 0411 0255 7 0216 0595 1044 1377 1490 1396 1171 0901 0646 0437 8 0081 0298 0653 1033 1304 1396 1318 1126 0888 0655 9 0027 0132 0363 0688 1014 1241 1318 1251 1085 0874 10 0008 0053 0181 0413 0710 0993 1186 1251 1194 1048 11 0002 0019 0082 0225 0452 0722 0970 1137 1194 1144 12 0002 0006 0034 0113 0264 0481 0728 0948 1094 1144 13 0002 0013 0052 0142 0296 0504 0729 0926 1056 14 0001 0005 0022 0071 0169 0324 0521 0728 0905 15 0002 0009 0033 0090 0194 0347 0534 0724 16 0003 0014 0045 0109 0217 0367 0543 17 0001 0006 0021 0058 0128 0237 0383 18 0002 0009 0029 0071 0145 0256 19 0001 0004 0014 0037 0084 0161 20 0002 0006 0019 0046 0097 21 0001 0003 0009 0024 0055 22 0001 0004 0012 0030 23 0002 0006 0016 24 0001 0003 0008 25 0001 0004 26 0002 387 Distribuční funkce O(u) rozložení N(0,1) ©(u) u ©(u) u ©(u) u ©(u) 0,00 0,50000 0,40 0,65542 0,80 0,78814 1,20 0,88493 0,01 0,50399 0,41 0,65910 0,81 0,79103 1,21 0,88686 0,02 0,50798 0,42 0,66276 0,82 0,79389 1,22 0,88877 0,03 0,51197 0,43 0,66640 0,83 0,79673 1,23 0,89065 0,04 0,51595 0,44 0,67003 0,84 0,79955 1,24 0,89251 0,05 0,51 994 0,45 0,67364 0,85 0,80234 1,25 0,79435 0,06 0,52392 0,46 0,67724 0,86 0,80511 1,26 0,89617 0,07 0,52790 0,47 0,68082 0,87 0,80785 1,27 0,89796 0,08 0,53188 0,48 0,68439 0,88 0,81057 1,28 0,89973 0,09 0,53586 0,49 0,68793 0,89 0,81327 1,29 0,90147 0,1 0 0,53983 0,50 0,691 46 0,90 0,81 594 1,30 0,90320 0,11 0,54380 0,51 0,69497 0,91 0,81859 1,31 0,90490 0,12 0,54776 0,52 0,69847 0,92 0,82121 1,32 0,90658 0,13 0,55172 0,53 0,70194 0,93 0,82381 1,33 0,90824 0,14 0,55567 0,54 0,70540 0,94 0,82639 1,34 0,90988 0,1 5 0,55962 0,55 0,70884 0,95 0,82894 1,35 0,911 49 0,16 0,56356 0,56 0,71226 0,96 0,83147 1,36 0,91309 0,17 0,56749 0,57 0,71655 0,97 0,83398 1,37 0,91466 0,18 0,57142 0,58 0,71904 0,98 0,83646 1,38 0,91621 0,19 0,57535 0,59 0,72240 0,99 0,83891 1,39 0,91774 0,20 0,57926 0,60 0,72575 1,00 0,84134 1,40 0,91924 0,21 0,58317 0,61 0,72907 1,01 0,84375 1,41 0,92073 0,22 0,58706 0,62 0,73237 1,02 0,84614 1,42 0,92220 0,23 0,59095 0,63 0,73565 1,03 0,84850 1,43 0,92364 0,24 0,59483 0,64 0,73891 1,04 0,85083 1,44 0,92507 0,25 0,59871 0,65 0,74215 1,05 0,85314 1,45 0,92647 0,26 0,60257 0,66 0,74537 1,06 0,85543 1,46 0,92786 0,27 0,60642 0,67 0,74857 1,07 0,85769 1,47 0,92922 0,28 0,61026 0,68 0,75175 1,08 0,85993 1,48 0,93056 0,29 0,61409 0,69 0,75490 1,09 0,86214 1,49 0,93189 0,30 0,61 791 0,70 0,75804 1,1 0 0,86433 1,50 0,933 19 0,31 0,62172 0,71 0,76115 1,11 0,86650 1,51 0,93448 0,32 0,62552 0,72 0,76424 1,12 0,86864 1,52 0,93574 0,33 0,62930 0,73 0,76730 1,13 0,87076 1,53 0,93699 0,34 0,63307 0,74 0,77035 1,14 0,87286 1,54 0,93822 0,3 5 0,63683 0,75 0,77337 1,1 5 0,87493 1,55 0,93943 0,36 0,64058 0,76 0,77637 1,16 0,87698 1,56 0,94062 0,37 0,64431 0,77 0,77935 1,17 0,87900 1,57 0,94179 0,38 0,64803 0,78 0,78230 1,18 0,88100 1,58 0,94295 0,39 0,65173 0,79 0,78524 1,19 0,88298 1,59 0,94408 u ©(u) u ©(u) u ©(u) u ©(u) 1,60 0,94520 2,00 0,97725 2,40 0,99180 3,1 0 0,99903 1,61 0,94630 2,01 0,97778 2,41 0,99202 3,12 0,99910 1,62 0,94738 2,02 0,97831 2,42 0,99224 3,14 0,99916 1,63 0,94845 2,03 0,97882 2,43 0,99245 3,16 0,99921 1,64 0,94950 2,04 0,97932 2,44 0,99266 3,18 0,99926 1,65 0,95053 2,05 0,97982 2,45 0,99286 3,20 0,99931 1,66 0,95154 2,06 0,98030 2,46 0,99305 3,22 0,99936 1,67 0,95254 2,07 0,98077 2,47 0,99324 3,24 0,99940 1,68 0,95352 2,08 0,98124 2,48 0,99343 3,26 0,99944 1,69 0,95449 2,09 0,98169 2,49 0,99361 3,28 0,99948 1,70 0,95543 2,10 0,98214 2,50 0,99379 3,30 0,99952 1,71 0,95637 2,11 0,98257 2,52 0,99413 3,32 0,99955 1,72 0,95728 2,12 0,98300 2,54 0,99446 3,34 0,99958 1,73 0,95818 2,13 0,98341 2,56 0,99477 3,36 0,99961 1,74 0,95907 2,14 0,98382 2,58 0,99506 3,38 0,99964 1,75 0,95994 2,15 0,98422 2,60 0,99534 3,40 0,99966 1,76 0,96080 2,16 0,98461 2,62 0,99560 3,42 0,99969 1,77 0,96164 2,17 0,98500 2,64 0,99585 3,44 0,99971 1,78 0,96246 2,18 0,98537 2,66 0,99609 3,46 0,99973 1,79 0,96327 2,19 0,98574 2,68 0,99632 3,48 0,99975 1,80 0,96407 2,20 0,98610 2,70 0,99653 3,50 0,99977 1,81 0,96485 2,21 0,98645 2,72 0,99674 3,55 0,99981 1,82 0,96562 2,22 0,98679 2,74 0,99683 3,60 0,99984 1,83 0,96638 2,23 0,98713 2,76 0,99711 3,65 0,99987 1,84 0,96712 2,24 0,98745 2,78 0,99728 3,70 0,99989 1,85 0,96784 2,25 0,98778 2,80 0,99744 3,72 0,99991 1,86 0,96856 2,26 0,98809 2,82 0,99760 3,80 0,99993 1,87 0,96926 2,27 0,98840 2,84 0,99774 3,85 0,99994 1,88 0,96995 2,28 0,98870 2,86 0,99788 3,90 0,99995 1,89 0,97062 2,29 0,98899 2,88 0,99801 3,95 0,99996 1,90 0,97128 2,30 0,98928 2,90 0,99813 4,00 0,99997 1,91 0,97193 2,31 0,98956 2,92 0,99825 4,05 0,99997 1,92 0,97257 2,32 0,98983 2,94 0,99836 4,10 0,99998 1,93 0,97320 2,33 0,99010 2,96 0,99846 4,15 0,99998 1,94 0,97381 2,34 0,99036 2,98 0,99856 4,20 0,99999 1,95 0,97441 2,35 0,99061 3,00 0,99865 4,25 0,99999 1,96 0,97500 2,36 0,99086 3,02 0,99874 4,30 0,99999 1,97 0,97558 2,37 0,99111 3,04 0,99882 4,35 0,99999 1,98 0,97615 2,38 0,99134 3,06 0,99889 4,40 0,99999 1,99 0,97670 2,39 0,99158 3,08 0,99897 4,45 1,00000 388 Kvantily standardizovaného normálního rozloženíuP p np P uP P up P np 0,50 0,000 0,75 0,674 0.950 1,645 0.975 1,960 0,51 0,025 0,76 0,706 0,951 1,655 0,976 1,970 0,52 0;050 0,77 0,739 0,952 1,665 0.977 1,995 0,53 0,075 0,78 0,772 0.953 1,675 0.978 2,014 0,54 0,100 0.79 0.806 0.954 1,685 0.979 2,034 0,55 0,126 0,80 0.842 0.955 1,695 0.980 2,054 0,56 0,151 0,81 0.878 0.956 1,706 0,981 2,075 0,57 0,176 0,82 0,915 0,957 1,717 0.982 2,097 0,53 0,202 0,83 0,954 0.958 1,728 0.983 2,120 0,59 0,228 0,84 0,994 0.959 1,739 0.984 2,144 0,(50 0,253 0,85 1.036 0.960 1,751 0.985 2,170 0,61 0,279 0,86 1.080 0.961 1,762 0.986 2,197 0,(52 0,305 0,87 1.126 0,962 1,774 0,987 2,226 0,63 0,332 0,88 1.175 0.963 1,787 0.988 2,257 0,(54 0,358 0,89 1.227 0.964 1,799 0.989 2,290 0,(55 0,385 0.90 1.282 0.965 1,812 0.990 2,326 0,(5(5 0:412 0,905 1.311 0.966 1,825 0.991 2,366 0,(57 0,440 0,910 1.341 0,967 1,838 0.992 2,409 0,68 0.468 0,915 1.372 0.968 1,852 0.993 2,457 0,(59 0.496 0,920 1,405 0.969 1,866 0.994 2,512 0,70 0.524 0,925 1.440 0.970 1,881 0.995 2,576 0,71 0,553 0,930 1.476 0,971 1,896 0,996 2,652 0,72 0,583 0,935 1.514 0,972 1,911 0.997 2,748 0,73 0,613 0,940 1.555 0.973 1,927 0.998 2,878 0,74 0,643 0,945 1.598 0,974 1,943 0,999 3,090 389 Kvantily Pearsonova rozložení %2(\) stupně - - pravděpodobnost - stupně pravděpodobnost volnosti 0,005 0,01 0,025 0,05 0,1 volnosti 0,90 0,95 0,975 0,99 0,995 1 0,0000 0,0002 0,00 10 0,0039 0,0158 1 2,706 4,605 3,841 5,991 5,024 7,378 6,63 5 9,210 7,879 10,597 2 0,0100 0,0201 0,0506 0,1026 0,2107 2 3 4 0,0717 0,2070 0,1148 0,2971 0,2158 0,4844 0,3519 0,7107 0,5844 1,0636 3 6,251 7,814 9,348 11,345 12,838 4 7,779 9,488 11,143 13,277 14,860 5 0,4117 0,5543 0,8312 1,1455 1,6103 5 9,236 11, 0 7 0 12,833 15,086 16,7 50 6 0,6757 0,8721 1,23 73 1,63 54 2,2041 6 10,645 12,017 12,592 14,067 14,449 16,013 16,812 18,475 18,548 20,278 7 0,9893 1,2390 1,6899 2,1673 2,8331 7 8 1,3444 1,6465 2,1797 2,7326 3,4895 8 13,362 15,507 17,535 20,090 21,955 9 1,7349 2,0879 2,7004 3,3251 4,1682 9 14,684 16,919 19,023 21,666 23,589 10 2,1559 2,5582 3,2470 3,9403 4,8652 10 15,987 18,307 20,483 23,209 25,188 1 1 2,6032 3,053 5 3,81 57 4,5748 5,5778 11 17,27 5 19,67 5 21, 9 2 0 24,725 26,757 12 3,0738 3,5706 4,4038 5,2260 6,3038 12 18,549 21,026 23,337 26,217 28,300 13 3,5650 4,1069 5,0088 5,8919 7,0415 13 19,812 22,362 24,736 27,688 29,819 14 4,0747 4,6604 5,6287 6,5706 7,7895 14 21,064 23,685 26,119 29,141 31,319 15 4,6009 5,2293 6,2621 7,2609 8,5468 15 22,307 27,996 27,488 30,578 32,801 1 6 5,1422 5,8122 6,90 77 7,9616 9,3122 16 23,542 26,296 28,845 32,000 34,267 17 5,6972 6,4078 7,5642 8,6718 10,085 17 24,769 27,587 30,191 33,409 35,718 18 6,2648 7,0149 8,2307 9,3905 10,865 18 25,989 28,869 31,526 34,805 37,156 19 6,8440 7,6327 8,9065 10,117 11,651 19 27,204 30,144 32,852 36,191 38,582 20 7,4338 8,2604 9,5908 10,851 12,443 20 28,412 31,410 34,170 37,566 39,997 2 1 8,0337 8,8972 10,2 83 11,591 13,240 21 29,6 1 5 32,67 1 35,479 38,932 41,40 1 22 8,6427 9,5425 10,982 12,338 14,041 22 30,813 33,924 36,781 40,289 42,796 23 9,2604 10,196 11,689 13,091 14,848 23 32,007 35,172 38,076 41,638 44,181 24 9,8862 10,856 12,401 13,848 15,659 24 33,196 36,415 39,364 42,980 45,599 25 10,520 11,524 13,120 14,611 16,473 25 34,382 37,652 40,646 44,314 46,928 26 11,1 60 12,198 13,8 44 15,379 17,292 26 35,563 38,885 41, 9 2 3 45,642 48,290 27 11,808 12,879 14,573 16,151 18,114 27 36,741 40,113 43,195 46,963 49,645 28 12,461 13,565 15,308 16,928 18,939 28 37,916 41,337 44,461 48,278 50,993 29 13,121 14,256 16,047 17,708 19,768 29 39,087 42,557 45,722 49,588 52,336 30 13,787 14,953 16,791 18,493 20,599 30 40,256 43,773 46,979 50,892 53,672 40 20,707 22,16 4 24,4 33 26,509 29,051 40 51, 805 55,7 58 59,342 63,691 66,766 50 27,991 29,707 32,357 34,764 37,689 50 63,167 67,505 71,420 76,154 79,490 60 35,534 37,485 40,482 43,188 46,459 60 74,397 79,082 83,298 88,379 91,952 70 43,275 45,442 48,758 51,739 55,329 70 85,527 90,531 95,023 100,43 104,21 80 51,172 53,540 57,153 60,391 64,278 80 96,578 101,88 106,63 112,33 116,32 90 59,1 96 61,754 65,6 47 69,1 26 73,291 90 107 ,57 113 , 1 5 118, 1 4 124, 1 2 128,30 100 67,328 70,065 74,222 77,929 82,358 100 118,50 124,34 129,56 135,81 140,17 200 152,24 156,43 162,73 168,28 174,84 200 226,02 233,99 241,06 249,45 255,26 300 240,66 245,97 253,91 260,88 269,07 300 331,79 341,40 349,87 359,91 366,84 500 422,30 429,39 439,94 449,15 459,93 500 540,93 553,13 563,85 576,49 585,21 390 KvantilyStudentova rozloženít(n) stupně pravděpodobnost volnosti 0,90 0,95 0,975 0,99 0,995 1 3,078 6,314 12,706 31,821 63,657 2 1,886 2,920 4,303 6,965 9,925 3 1,638 2,353 3,182 4,541 5,841 4 1,533 2,132 2,776 3,747 4,604 5 1,476 2,015 2,571 3,365 4,032 6 1,440 1,943 2,447 3,143 3,707 7 1,415 1,895 2,365 2,998 3,499 8 1,397 1,860 2,306 2,896 3,355 9 1,303 1,833 2,262 2,821 3,250 10 1,372 1,812 2,228 2,764 3,169 11 1,363 1,796 2,201 2,718 3,106 12 1,356 1,782 2,179 2,681 3,055 13 1,350 1,771 2,160 2,650 3,012 14 1,345 1,761 2,145 2,624 2,977 15 1,341 1,753 2,131 2,602 2,947 16 1,337 1,746 2,120 2,583 2,921 17 1,333 1,740 2,110 2,567 2,898 18 1,330 1,734 2,101 2,552 2,878 19 1,328 1,729 2,093 2,539 2,961 20 1,325 1,725 2,086 2,528 2,845 21 1,323 1,721 2,080 2,518 2,831 22 1,321 1,717 2,074 2,508 2,819 23 1,319 1,714 2,069 2,500 2,807 24 1,318 1,711 2,064 2,492 2,797 25 1,316 1,708 2,060 2,485 2,878 26 1,315 1,706 2,056 2,479 2,779 27 1,314 1,703 2,052 2,473 2,771 28 1,313 1,701 2,048 2,467 2,763 29 1,311 1,699 2,045 2,462 2,756 30 1,310 1,697 2,042 2,457 2,750 40 1,303 1,684 2,021 2,423 2,704 60 1,296 1,671 2,000 2,390 2,660 120 1,289 1,658 1,980 2,358 2,617 ¥ 1,282 1,645 1,960 2,326 2,576 391 v2 *l 1 2 3 4 5 6 7 S 9 1 161,45 199,50 215,71 224,58 230,1.6 233,99 236,77 235,33 240,54 2 13,513 19,000 19,164 19,247 19,296 19,330 19,353 19,371 19,335 3 10,123 9,552 9,277 9,117 9,014 3,941 S:8S7 5,545 3,312 4 7,709 6,944 6,591 6,333 6,256 6,163 6,094 6,041 5,999 5 6,605 5,756 5,410 5,192 5,050 4,950 4:876 4,515 4:773 6 5,937 5,143 4,757 4,534 4,337 4,234 4,207 4,147 4,099 5,591 4:737 4,347 4,120 3,972 3,366 3,757 3,726 3,677 S 5,318 4,459 4,066 3,333 3,633 3,531 3,501 3,435 3.338 9 5,117 4:257 3,363 3,633 3,432 2,274 3,293 3,230 3:179 10 4,965 4,103 3,70S 3,473 3,326 3,217 3,136 3,072 3,020 11 4,544 3,952 3,5S7 3,357 3,204 3,095 3,012 2,945 2,396 12 4,747 3:S35 3,490 3,259 3,106 2,996 2,913 2,549 2,796 13 4,667 3:806 3.411 3,179 3,025 2,915 2,832 2,767 2:714 14 4,600 3,739 3,344 3,112 2,953 2,543 2,764 2,699 2,646 15 4,543 3,652 3,237 3,056 2:901 2,791 2,707 2,641 2.538 16 4,494 3:634 3,239 3,007 2,352 2,741 2,657 2,591 2,533 17 4,451 3,592 3,197 2,965 2:S10 2,699 2,614 2,545 2,494 IS 4,414 3,555 3,160 2,923 2,773 2,661 2,577 2,510 2,456 19 4,331 3,522 3,127 2,395 2,740 2,623 2,544 2,477 2.423 20 4,351 3,493 3,09S 2,366 2.711 2,599 2.5:4 2,447 2,393 21 4,325 3,467 3,073 2,340 2:6S5 2,573 2458 2,421 2,366 22 4,301 3,443 3,049 2,317 2:661 2,549 2,464 2,397 2:342 23 4,279 3,422 3,02S 2.796 2,640 2,523 2,442 2,375 2.320 24 4,260 3,403 3,009 2:776 2,621 2,503 2,423 2,355 2,300 25 4,242 3,355 2,991 2,603 2,490 2,405 2.33" 2,232 26 4,225 3:369 2,975 2:743 2,537 2,474 2:3SS 2,321 2,266 27 4,210 3,354 2,960 2,723 2,572 2,459 2,373 2,305 2.2 50 25 4,196 3,340 2,947 2.714 2,553 2.445 2,359 2,291 2,236 29 4,133 3,328 2,934 2:701 2,545 2.432 2,346 2,27S 2:223 30 4,171 3,316 2,922 2,690 2.334 2,421 2,334 2,266 2:211 40 4.035 3,232 2,S39 2.606 2,450 2,336 2,249 2,130 2.124 50 4,001 3,150 2,753 2,525 2,363 2.234 2,167 2,097 2,040 120 3,920 3,072 2,630 2:447 2,290 2,175 2,057 2,016 1,959 co 3,542 2,996 2,605 2,372 2,214 2,099 2,010 1,935 1,330 392 V2 Vi 10 12 15 20 24 30 40 60 120 1 241,88 243,91 245,95 248,01 249,05 250,09 251,14 252,20 253,25 254,32 -J 19,396 19,413 19,429 19,446 19,454 19,462 19,471 19,479 19,437 19:496 8,736 8,745 S ,703 2.660 Sľ639 3,617 8:594 8,572 8,549 3,527 4 5,964 5,912 5:S5S 5,803 5,774 5,746 5,717 5,638 5,658 5,623 5 4.735 4,678 4,619 4,558 4,527 4,496 4,464 4,431 4,398 4,365 6 4,060 4,000 3:93S 3,874 3,S42 3,303 3,774 3,7+0 3,705 3,669 3,637 3,575 3,511 3,44: 3,411 3,376 3,340 3,304 3.267 3,230 S 3,347 3,284 3,213 3,150 3,115 3,079 3,043 3,005 2,967 2,923 q 3,137 3,073 3,006 2,937 2,901 2,364 2,326 2. 2,748 2,707 10 2,973 2,913 2,345 2,774 2,737 2,700 2,661 2,621 2,530 2,533 11 2,S54 2,785 2,719 2,646 2,609 2.571 2,531 2,490 2,448 2,405 12 2,753 2,687 2,617 2.544 2,506 2,466 2,426 2,334 2,341 2,296 13 2,671 2,604 2,533 2,459 2,420 2,380 2,339 2,297 2.25-2 2,206 14 2,602 2,534 2,463 2.338 2,349 2,303 2,266 2.223 2,178 2.131 15 2,544 2,475 2,404 2,328 2,235 2,247 2,204 2,160 2,114 2,066 16 2,494 2,425 2,352 2,276 2,235 2,194 2,151 2,106 2,059 2,010 17 2,450 2,381 2,303 2,230 2,190 2,143 2,104 2,058 2,011 1,960 18 2.412 2,342 2,269 2,191 2,150 2.107 2,063 2,017 1,968 1,917 19 2,378 2,3 OS 2.234 2.136 2,114 2.C"1 2,026 1,930 1,930 1,878 20 2,348 2,27S 2,203 2:124 2,033 2,039 1,994 1,946 1,896 1,843 21 2,321 2,250 2,176 2,096 2,054 2,010 1,965 1,917 1,866 1,812 ■it 2,297 2,226 2.151 2.071 2,02S 1,984 1.933 1,890 1,838 1.783 23 2,275 2,204 2,123 2,048 2,005 1,961 1,914 1,865 1,813 1,757 24 2.255 2,183 2,103 2:027 1,984 1,939 1,892 1,842 1,790 1,733 25 2,237 2,165 2,0S9 2,008 1,964 1,919 1,872 1,822 1,768 1,711 26 2.220 2,148 2,072 1,990 1,946 1,901 1,353 1,803 1,749 1,691 2,204 2,132 2,056 1,974 1,930 1,384 l:S3ó 1,735 1,731 1,672 2S 2,190 2,IIS 2,041 1,959 1,915 1,369 1,820 1,769 1,714 1,654 29 2,177 2,105 2,023 1,945 1,901 1,354 1,306 1,754 1,698 1,633 30 2,165 2,092 2,015 L932 1,S37 1,341 1,792 1,740 1,634 1,622 40 2,077 2,004 1,925 1,839 1,793 1.744 1,693 1,637 1,577 1,509 60 1,993 1,917 1,336 1,748 1,700 1,649 1,594 1,534 1,467 1,389 120 1,911 1,834 1,751 1,659 1,60S 1.554 1,495 1,429 1,352 1,254 00 1,S31 1,752 1,666 1.571 1,517 1,459 1,394 1,318 1,221 1,000 393 \r2 V] 1 -i 3 4 5 6 7 S 9 1 647,79 799:50 864,16 S99,5S 921,85 937,11 943:22 956,66 963,23 2 35,506 39,000 39,165 39,248 39,298 39:331 39,355 39,373 39,337 3 17,443 16,044 15,439 15,101 14,885 14,735 14,624 14,540 14,473 4 12:21B 10,049 9,979 9,605 9:365 9,197 9,074 8,930 S.905 5 10,007 8:434 7,764 7,3SS 7,140 6,973 6:853 6,757 6,631 6 8,813 7,260 6,599 6,227 5:9SS 5,820 5.696 5,600 5,523 7 8,073 6,542 5,390 5,523 5:2S5 5,119 4:995 4,899 4,323 S 7,571 6,060 5,416 5,053 4,317 4,652 4,529 4,433 4.35 7 9 7,209 5:715 5,07S 4,713 4,434 4,320 4,197 4,102 4,026 10 6,937 5,456 4,326 4,463 4,230 4,072 3,950 2^55 3:779 11 6,724 5,256 4,630 4:275 4,044 3,331 3,759 3,664 3,538 12 6,554 5:096 4,474 4,121 3,391 3,723 3,607 3,512 3,436 13 6,414 4:965 4,347 3,996 3,767 3,604 3,483 3,333 3,312 14 6,298 4,357 4,242 3,392 3,663 3,501 3,380 3,285 3,209 15 6,200 4,765 4,153 3,304 3,576 3,415 3,293 3,199 3,123 16 6,115 4:657 4,077 3,729 3,502 3.341 3,219 3,125 3,049 17 6,042 4:619 4,011 3,665 3,433 3,277 3,156 3,061 2,935 IS 5,978 4,560 3,954 3,603 3,332 3,221 3,100 3,005 2,929 19 5,922 4:5QS 3,903 3,559 3,333 3.172 3,051 2,956 2,330 20 5,872 4,461 3,359 3,51 = 3,239 3,123 3,007 2,913 2,337 21 5,827 4,420 3,319 3:475 3,250 3,090 2:969 2,874 2,793 22 5,786 4,383 3,733 3,440 3,215 3,055 2,934 2,839 2,763 23 5,750 4:349 3,751 3,403 3,134 3,023 2,902 2,80« 2:731 24 5,717 4,319 3,721 3,379 3,155 2,995 2,874 2,779 2,703 25 5,636 4,291 3,694 3.3 33 3,129 2,969 2:S4S 2,753 2:677 26 5,659 4,266 3,670 3,329 3,105 2,945 2:S24 2,729 2,653 27 5,633 4,242 3,647 3,307 3,033 2,923 2,302 2,707 2,631 28 5,610 4,221 3,626 3,236 3,063 2,903 2,782 2,637 2,611 29 5,583 4,201 3,607 3,267 3,044 2,334 2,763 2,669 2,592 30 5,568 4,182 3,539 3,250 3,027 2.s6~ 2,746 2,651 2,557 40 5,424 4,051 3,463 3,126 2,904 2/44 2,624 2,529 2,452 60 5,286 3:925 3,343 3,003 2,736 2,627 2,507 2,412 2,334 120 5,152 3,805 3,227 2,394 2,674 2,515 2,395 2,299 2.222 00 5,024 3,639 3,116 2,736 2,567 2,403 2:2SS 2,192 2,114 10 12 15 20 24 30 40 60 120 DC 1 963,93 976,71 934,37 993,10 997,25 1001,4 1005,6 1009,3 1014:0 1018,3 2 39:39S 39,415 39,431 39,443 39,456 39,465 39,473 39,481 39,490 39:49S 3 14,419 14,337 14,253 14,167 14,124 14,031 14,037 13,992 13,947 13,902 4 3,844 S,751 S:657 3.560 8,511 S ,461 3,411 3,360 3,309 3,257 5 6,619 6,525 6:42S 6,3 29 6,278 6,227 6,175 6,125 6,069 6,0115 6 5,461 5,366 5,269 5,163 5,117 5,065 5,013 4,959 4,905 4,349 4,761 4,666 4:56S 4,467 4,415 4,362 4,309 4,256 4,199 4,142 S 4,295 4,200 4,101 4,000 3,947 3,894 3:840 3,784 3,723 3,670 3,964 3,865 3,769 3,667 3,614 3,560 3,506 3,449 3,392 3.333 10 3,717 3,621 3,522 3.41? 3,365 3,311 3,255 3,193 3,140 3,080 11 3,526 3,430 3,330 3.226 3,173 3,118 3,061 3,004 2,944 2,383 12 3,374 3,277 3,177 3,073 3,019 2,963 2,906 2,843 2,737 2:725 13 3,250 3,153 3,053 2,943 2,893 2.537 2:7BB0 2,720 2,659 2,596 14 3,147 3,050 2,949 2,344 2,739 2,732 2,674 2,614 2,552 2,487 15 3,060 2,963 2:862 2,756 2,701 2,644 2,585 2,524 2,461 2,395 16 2,936 2,389 2,788 2,681 2,625 2,568 2,509 2,447 2,333 2,316 17 2,922 2,825 2,723 2,616 2,560 2,502 2,442 2,380 2,315 2:247 IS 2,866 2,769 2:667 2,559 2,503 2,445 2,384 2,321 2,256 2,187 19 2,S17 2,720 2,617 2,509 2,452 2,394 2.333 2,270 2.203 2.133 20 2,774 2,676 2,573 2.465 2403 2,349 2,287 2.223 2,156 2,085 21 2.735 2,637 2,534 2,425 2,363 2,308 2,247 2,182 2,114 2,042 22 2.700 2,602 2:49S 2,3S9 2,332 2,272 2,210 2.145 2,076 2,003 23 2,66S 2,570 2,467 2:357 2,299 2,239 2,176 2.111 2,042 1,968 24 2,640 2,541 2,437 2:327 2,269 2,209 2,146 2,080 2,010 1,935 25 2,614 2,515 2,411 2,301 2,242 2,132 2,113 2,052 1,931 1,906 26 2,590 2,491 2,387 2:276 2,217 2.157 2,093 2,026 1,955 1,373 27 2,5 6S 2,469 2,364 2.2 33 2,195 2,133 2,069 2,002 1,930 1,353 28 2,547 2,448 2,344 2.232 2,174 2.112 2:043 1,980 1,907 1,329 29 2,529 2,430 2,325 2.213 2,154 2,092 2,028 1,959 1.336 1,307 30 2,511 2,412 2,307 2,195 2,136 2,074 2,009 1,940 1.366 L787 40 2,3 S S 2,285 2,182 2,063 2,007 1,943 1,375 1,803 1/24 1,637 60 2,270 2,169 2,061 1,945 1.SS2 1,815 1,744 1,667 1,531 1,482 120 2,157 2,055 1,945 1,325 1,760 1,690 1,614 1,530 1,433 1,310 OD 2,045 1,945 1,833 1,709 1,640 1,556 1:4S4 1.3SS 1,268 1,000 395 V2 ''■'] 1 2 4 5 6 S 9 1 4052,2 4999,5 5403,5 5624:6 5763,7 5859,0 5928,3 5931,6 6022,5 2 98,503 99,000 99,166 99,249 99,299 99,332 99,356 99,374 99:3SS 3 34,116 30,317 29,457 2S,710 28,237 27,911 27,672 27.45? 27:345 4 21,19« 18,000 16,694 15:977 15,522 15,207 14,976 14,799 14:639 5 16.253 13,274 12,060 11,392 10,967 10,672 10,456 10.239 10.153 6 13,745 10,925 9,730 9,143 S:746 3,466 S:260 8,102 7,976 7 12:246 9,547 8,451 7. £47 7,460 7,191 6:993 6,840 6,719 S 11,259 S:649 7,591 7,006 6,632 6,371 6,178 6,029 5,911 9 10,561 8:022 6,992 6,422 6,057 5,802 5,613 5,467 5.3 51 10 10,044 7,559 6,552 5,994 5.6^6 5,336 5,200 5,057 4.942 11 9,646 7,206 6,217 5,663 5,316 5,069 4:836 4,745 4,632 12 9,330 ô ,92 7 5,953 5.41: 5,064 4,821 4:640 4,499 4,338 13 9,074 e ,701 5,739 5.205 4,362 4,620 4,441 4,302 4,191 14 3,362 6,515 5,564 5,035 4,695 4,456 4,278 4.140 4,030 15 3,683 6:359 5,417 4,393 4,556 4,313 4,142 4,005 3,395 16 3,531 6,226 5,292 4,773 4,437 4,202 4:026 3,890 3,730 17 3,400 6,112 5,135 4,669 4,336 4,102 3,927 3,791 3,632 IS 3,285 6,013 5,092 4,579 4,423 4,015 3:S41 3,705 3,597 19 3,185 5:926 5,010 4,500 4.171 3,939 3,765 3,631 3,523 20 3,096 5,849 4,933 4,431 4,103 3,871 3:699 3,564 3,457 21 3,017 5,780 4,S74 4,369 4,042 3,812 3:640 3,506 3,393 22 7,945 5,719 7,317 4,313 3,933 3,753 3,587 3,453 3,346 23 7,831 5:664 4,765 4,264 3,939 3,710 3,539 3,406 3,299 24 7,S23 5,614 4,71S 4,213 3:S95 3,667 3:496 3,363 3,256 25 7,770 5:568 4,676 4,177 3,355 3,627 3,457 3,324 3,217 26 7,721 5,526 4,637 4,140 3:S1S 3,591 3,421 3,283 3,132 27 7,677 5:45S 4,601 4,106 3,735 3,553 3:35S 3,256 3,149 28 7,636 5,453 4,56S 4,074 3,754 3,523 3:358 3,226 3,120 29 7,598 5,421 4,53S 4,045 3,725 3,500 3,330 3,198 3,092 30 7,563 5:390 4,510 4,013 3,699 3,474 3,305 3,173 3,067 40 7,314 5,179 4,313 3,323 3,514 3,291 3,124 2,993 2,333 60 7,077 4,977 4,126 3,649 3,339 3,119 2,953 2,823 2.719 120 6,851 4,787 3,949 3,4S0 3,174 2,956 2,792 2,663 2,559 6,635 4,605 3,732 3,319 3,017 2,802 2:639 2,511 2,407 396 v] v] 10 12 15 20 24 30 40 60 120 DC 1 6055:S 6106,3 6157,3 6208,7 6234,6 6260,7 Ó286,S 6313,0 6339:4 6366,0 2 99,399 99,416 99,432 99,449 9 9,45 S 99,466 99,474 99:4S3 99,491 99,501 3 27,225 27:052 26,872 26,690 26,598 26,505 26,411 26,316 26,221 16:125 4 14,546 14,374 14,198 14,020 13,929 13,838 13,745 13:652 13,553 13,463 5 10,051 9, SB B 9,722 * :öü 9,467 9,379 9,291 9,202 9,112 9,020 6 7,874 7,718 7,396 7,313 7,229 7,143 7,057 6,969 6,380 1 6,620 6,469 6,314 6.155 6,074 5,992 5:90E 5,824 5,737 5,650 S 5,814 5,667 5,515 5,359 5,279 5,19S 5,116 5,032 4,946 4,359 9 5,257 5,111 4:962 4,303 4,729 4,649 4,567 4,483 4,393 4:311 10 4,849 4,706 4,55S 4,405 7,327 4.247 4,165 4,0S2 3,997 3,909 11 4,539 4,397 4,099 4,021 3,941 3:860 3,776 3,690 3,603 12 4,296 4,155 4,010 3,353 3,781 3,701 3:619 3,536 3,449 3,361 13 4,100 3,960 3,315 3,665 3,587 3,507 3,425 3.341 3,255 3,165 14 3,939 3,800 3,656 3,505 3,427 3,348 3,266 3,181 3,094 3,004 15 3,805 3,666 3,522 3.3 7: 3,294 3,214 3,132 3,047 2,960 2,368 16 3,691 3,409 3,259 3,181 3,101 3:01E 2,933 2,845 2:753 17 3,593 3,455 3,312 3,162 3,084 3,003 2,921 2.SÍ-:" 2,746 2,653 IS 3,5 OS 3,371 3,227 3,077 2,999 2,919 2,835 2,749 2,660 2,566 19 3,434 3,297 3,153 3,003 2,925 2,S44 2,761 2,674 2,584 2,489 20 3,363 3,231 3,osa 2,933 2,859 2,779 2,695 2,603 2,517 2:421 21 3,310 3,173 3,030 2,380 2,801 2,720 2:636 2,543 2,457 2,360 22 3,25S 3,121 2:97S 2,327 2,749 2,66S 2,583 2,495 2,403 2,306 23 3,211 3,074 2,931 2,7S1 2,702 2,620 2,536 2,447 2,354 2.2^6 24 3,163 3,032 2:8S9 2,733 2,659 2,577 2,492 2,404 2,310 2:211 25 3,129 2,993 2:S50 2,699 2,620 2,53S 2,453 2,364 2,270 2,169 26 3,094 2,958 2,815 2,664 2,585 2,503 2,417 2,327 2,233 2.132 27 3,062 2,926 2,783 :.6;: 2,552 2,470 2,384 2,294 2,193 2,097 28 3,032 2,896 2,753 2,602 2,522 2,440 2,354 2,263 2,167 2,064 29 3,005 2,869 2,726 2:574 2,495 2.412 2,325 :.:í4 2,133 2,034 30 2,979 2,843 2,700 :.:-4? 2,469 2,336 2,299 2,203 2,111 2,006 40 2,801 2,665 2,522 2,369 2,288 2,203 2,114 2,019 1,917 1,305 60 2,632 2,496 2,352 2,193 2,115 2,029 1:936 1,836 \~16 1,601 120 2,472 2,336 2,192 2,035 1,950 1,S60 1,763 1,656 1,533 1,381 00 2,321 2,185 2,039 1,373 1,791 1:696 1,592 1,473 1,325 1,000 397 vi vi 1 3 4 5 6 S 9 1 16211 20000 21615 22500 23056 23437 23715 23925 24091 2 198,50 199,00 199,17 199,25 199,30 199,33 199,36 199,37 3 55,552 49,799 47,467 46,196 45,352 44,838 44,434 44,126 43,882 4 31,333 26,234 24,259 23,155 22,456 21,975 21,622 21,352 21,139 5 22,785 18,314 16,530 15:556 14,940 14,513 14,200 13,961 13,772 6 18,635 14,544 12,917 12,028 11,464 11,073 10,736 10,566 10,391 7 16,236 12,404 10,382 10:050 9,522 9,155 S:SS5 8,678 8,514 S 14,6SS 11,042 9,597 8,305 8,3302 7,952 7,694 7,496 7,339 9 13,614 10,107 8,717 7,956 7,471 7,134 6:SS5 6,693 6,541 10 12,326 9,427 3,031 7.343 6,S72 6,545 6,303 6,116 5,968 11 12,226 8,912 7,000 ó.SSI 6,422 6,102 5:S65 5,682 5:537 12 11,754 8,510 7,226 6,521 6,071 5,757 5,525 5,345 5,202 13 11,374 8,187 6,926 6,234 5,791 5,4S2 5.253 5,076 4,935 14 11,060 7,922 6,630 5,993 5:562 5,257 5,031 4,857 4,717 15 10,793 7:701 6,476 5,303 5,372 5,071 4,847 4,674 4,536 16 10,575 7:514 6,303 5,633 5,212 4,913 4:692 4,521 4,3S4 17 10,384 7,354 6,156 5,497 5,075 4,779 4,559 4,389 4,254 IS 10,21 S 7:215 6,023 5,375 4,956 4,663 4,445 4,276 4.141 19 10,073 7,094 5,916 5,263 4,S53 4,561 4,345 4,177 4,043 20 9,944 6,987 5,S1S 5,174 4.7(52 4,472 4,257 4,090 3,956 21 9,830 6,891 5,730 5,091 4:6S1 4,393 4,179 4,013 3, SSO 22 6:S06 5,652 5,017 4,609 4.323 4,109 3,944 3,312 23 9*635 6:730 5,532 4,950 4,544 4,259 4,047 3,382 3,750 24 9,551 6,661 5,519 4,390 4:4S6 4,202 3:991 3,826 3,695 25 9,475 6:598 5,462 4,335 4,433 4,150 3:939 3,776 3,645 26 9,406 6,541 5,409 4,7S5 4,334 4,103 3:893 3,730 3,599 21 9,342 6:4S9 5,361 4,740 4,340 4,059 3:S50 3,683 3,557 28 9,2 84 6:440 5,317 4,693 4,300 4,020 3,811 3,649 3,519 29 9,230 6:396 5,276 4,659 4,262 3,9S3 3,775 3,613 3,4S3 30 9,180 6,355 5,239 4,623 4.225 3,949 3,742 3,580 3.451 40 3,828 6:066 4,976 4,374 3,936 3,713 3,509 3,350 3.222 60 3,495 5,795 4,729 4,140 3,760 3,492 3,291 3,134 3,003 120 3,179 5,539 4,497 3,921 3,54S 3,2S5 3,087 2,933 2.S08 00 7,879 5,298 4,279 3,715 3,350 3,091 2:S97 2,744 2,621 398 \'2 V] 10 12 15 20 24 30 40 60 120 □c 1 24,224 24426 24630 24B36 24940 25044 25143 25253 25359 25465 2 199,40 199,42 199,43 199,45 199,46 199,47 199.47 199,48 199,49 199,51 3 43,686 43,357 43,085 42,778 42,622 42,466 42,305 42:149 41,959 41,829 4 20,967 20:705 20,43S 20,167 20:O3O 19,892 19,752 19,611 19,468 19:325 5 13,618 13,354 13,146 12,903 12:7EO 12,656 12,530 12:402 12:274 12,144 6 10,250 10,034 9:814 9,559 9,474 9,358 9,241 9,122 9,002 8,379 7 3.350 8,176 7.965 7.754 7,645 7,735 7,423 7,309 7,193 7.076 S 7,211 7,015 6:814 6,603 6,503 6,396 6:2S8 6,177 6,065 5,951 9 6,417 6,227 6,033 5,332 5,729 5:62 5 5,519 5.410 5,300 5,188 10 5,847 5,661 5,471 5:274 5,173 5,071 4,966 4,859 4,750 4,639 11 5,413 5,236 5,049 4.355 4,756 4,654 4,551 4,445 4,337 4.226 12 5,0S6 4,906 4,721 4,530 4,432 4.331 4,228 4,123 4,015 3,904 13 4,820 4,643 4:460 4:270 4,173 4,073 3:970 3,366 3,753 3,647 14 4,G03 4,428 4,247 4,059 3,961 3,562 3,760 ^,655 3,547 3,436 15 4,424 4,250 4,070 3,353 3,786 3,637 3,585 3,450 3,372 3,260 16 4,272 4,099 3,921 3,734 3,638 3,535 3,437 3,332 3,224 3,112 17 4.142 3,971 3,793 3,607 3,511 3,412 3,311 3,206 3,097 2,984 13 4,031 3,560 3,683 3,493 3,402 3,303 3,201 3,096 2,987 2,373 19 3,933 3,763 3,587 3,402 3,306 3,205 3,106 3,000 2,891 2,176 20 3,847 3,678 3,502 3,313 3,222 3,123 3,022 2,916 2,306 2,690 21 3,771 3,602 3,427 3,243 3,147 3,049 2,947 2,841 2,730 2,614 22 3,703 3,535 3,360 3,176 3,081 2,932 2:ES0 2.774 2,663 2,546 23 3,642 3,475 3,300 3,117 3,021 2,922 2:E20 2,713 2,602 2,484 24 3,5S7 3,420 3,246 3,062 2,967 2,565 2,765 2,659 2,546 2,428 25 3,537 3,370 3,196 3.013 2,918 2,519 2,716 2,609 2,496 2:377 26 3,492 3,325 3,152 2,969 2,873 2.7-4 2,671 2,563 2,450 2,330 27 3,450 3,284 3,110 2,923 2,832 2,733 2,630 2.522 2,403 2:2S7 28 3,412 3,246 3,073 2,390 2,794 2,695 2,592 2,453 2,369 2:247 29 3,377 3,211 3,035 2,355 2,759 2,660 2,557 2,443 2.33 3 2:210 30 3,344 3,179 3,006 2,323 ■i - " - 2,625 2,524 2.-15 2,300 2.176 40 v17 2,953 2.7S1 2,593 2,402 2,296 2,154 3,064 1,932 fiO 2.904 2,742 2,571 2,357 2,290 2,137 2,079 1,962 1,834 1.6SS 120 2.705 2,544 2,373 2,153 2,089 1,934 1,871 1,747 1,606 1:431 OD 2,519 2,358 2,187 2,000 1,898 1:739 1,669 1,533 1.364 1,000 399 Literatura > Budíková, Marie - Mikoláš, Štěpán - Osecký, Pavel. Popisná statistika. 3., doplněné vyd. Brno : Masarykova univerzita, 1998. 52 s. ISBN 80-210-1831-3. > Budíková, Marie - Mikoláš, Štěpán - Osecký, Pavel. Teorie pravděpodobnosti a matematická statistika. Sbírka příkladů. 3. vyd. Brno : Masarykova univerzita, 2004. 127 s. ISBN 80-210-3313-4. > Michal Friesl - výukové texty (např. Pravděpodobnost a statistika, Posbíranépříklady z pravděpodobnosti a statistiky,...): http://home.zcu.cz/~friesl/Archiv/DldTeach.html > Blanka Šedivá - Pravděpodobnost a statistika: http://home.zcu.cz/~sediva/pse/ > Michal Cihák - výukové texty: http://www.cihak.com/michal/ > Petr Otipka, Vladislav Šmajstrla - Pravděpodobnost a statistika: http://homen.vsb.cz/~oti73/cdpast 1/ > Jana Novovičová - Pravděpodobnost a matematická statistika: http:// euler.fd.cvut.cz/publikace/iiles/skripta3 .pdf 400