1 Výpočet číselných charakteristik náhodných veličin Vyjádření k domácímu úkolu Stará látka Normálni rozložení • náhodná veličina — diskrétni * pstní fce * distr fce — spojitá * hustota * distr fce • Náhodná veličina X ~ N(fi, a2) • Střední hodnota E (X) = fi, rozptyl D (X) = a2. • posunutí, rozptyl standardizované normálni rozložení • fj, = 0, a2 = 1 • r/~iV(0,l) • distribuční fce: • hodnoty distr. fce jsou tabelovány pro u > 0 • pro u < 0 používáme přepočtový vzorec <&(—«) = 1 — <&(w). 1 1.1 Nová látka: Vlastnosti normálního rozložení • Pokud X ~ N(/i, a2), potom X ~ ^ ^ JV(0,1) • Pokud X ~ N(fi, o-2), potom A = a + bX ~ iV(a + &V2) • X1... Xn- Xt ~ iV(/xí; a2), potom F = £ľ=i X, ~ N(£ti ^ £ľ=i ^) Číselné charakteristiky náh.veličin • F(x),p(x),f(x) ... funkcionální charakteristiky — obsahují veškerou informaci o chování náh.veličiny • někdy nás zajímají pouze rysy chování náh.veličiny • k tomu slouží číselné charakteristiky — kvantily — střední hodnota — rozptyl / směrodatná odchylka — kovariance — korelace a-kvant il • a-kvantil náh.veličiny X • ua(X) • obdoba a-kvantilu v popisné statistice • křivka hustoty: — plocha pod křivkou ... pst ... = 1 — tuto plochu rozdělíme na 2 části * tmavá plocha a * světlá plocha 1 — a — pst, že náhodná veličina X se realizuje hodnotou menší nebo rovnou hodnotě ua(X) — číslo ua(X) nazýváme a — kvantilem spojité náhodné veličiny. — a = P(X < ua(X)) — platí vztah ua = -ui-a (2) — speciální kvantily 2 * medián * 1. kvart il * 3. kvart il — Pearsonovo rozložení X ~ X2(n) ■ ■ ■ nesymetrické — Studentovo rozložení X ~ t(n) ... symetrické ... t0 — Fisherovo-Snedecorovo rozložení X ~ F(ni,n2) R-příkazy — qnorm(oí, mean=, sd= ) — qchisq(a, n) — qt(a, n) — qf(a,ni,n2) Příklad: -íi- l-a ■ ■ Uq.25 — —Uq.75 . .ltQ.5 = 0.5 .. u0.75 = 0.674 13.120 1. U ~ N(0; 1);... u0.25 = -uo.75 = -0.674 2. ř/~iV(0;ť 3. ř/~iV(0;ť 4- XŽ.o25(25) = 5. í0.99(30) = 2.45 7 6. X ~ iV(3, 5)... xo.25 =? — Najdeme 0.25-kvantil pro £7 ~ -/V(0; 1) —> «0.25 — platí U a -0.674 X = alf + //=>- Xo.25 = O""o.25 + y" = ^0.25 = 75(-0.674) + 3 = 1.49 (3) střední hodnota fi • nese informace o střední poloze • střední hodnota diskrétní náhodné veličiny 00 E(X) = ^xp(x) —00 • střední hodnota spojité náhodné veličiny /oo xf(x)dx -00 • může se stát, že náhodná veličina X nemá střední hodnotu • jde o idealizovaný průměr; značí se /i a výběrový ekvivalent je aritm. průměr m • střední hodnota diskrétní transformované náhodné veličiny E(Y)=E(g(X)) = Y,g(x)p(a (4) (5) [x (6) 3 1.1.1 Vlastnosti střední hodnoty 1. E (a) = a 2. E (a + bX)=a + bE(X) 3. E(X1 + X2) = EX1 + EX2 4. E(X1 + ...,Xn) = EX1 + ...EXn rozptyl • určuje, jak moc je náhodná veličina variabilní, jakou má tendenci realizovat se poblíž/daleko centrální polohy • značíme D(X), a2 • teoretický protějšek s2 = ^ Yľi=i(xí ~ m)2] m Je arit m. průměr, nebo medián • čím více se hodnoty v souboru navzájem liší, tím je hodnota rozptylu vyšší, kdyby celý soubor byl složen z 1, pak by rozptyl byl 0 D(X) = E([X - E(X)]2) (7) • X porovnáme s její střední hodnotou, tuto odchylku umocníme na druhou a z kvadrátů všech X vypočítáme střední hodnotu • rozptyl diskrétní náh.veličiny oo D{X) = E([X - E{X)f) = ]>> - E(X)]2p(x) (8) — oo • rozptyl spojité náh.veličiny /oo [x - E(X)]2f(x)dx (9) -oo • yjD(X) je směrodatná odchylka 1.1.2 Vlastnosti rozptylu 1. D(X) = E(X2) - [EX]2 2. D (a) = 0 3. D (a + bX) = b2D(X) 4. jsou-li náh.vel. stoch.nezáv, potom D(Xi + X2) = D(Xi) + D(X2) 5. jsou-li náh.vel. stoch.nezáv, potom D(X\ + ... Xn) = D(Xi) + ... D(Xn) 4 • Příklad: Náhodná veličina X udává počet ok při hodu kostkou. Vypočtěte střední hodnotu EX a rozptyl DX. — Náhodná veličina X je diskrétního charakteru — střední hodnota EX: * k výpočtu střední hodnoty potřebujeme znát pstní fci pro všechny možné jevy: * P(X = 1) = 1/6, P(X = 2) = 1/6, P(X = 3) = 1/6, P(X = 4) = 1/6, P(X = 5) = 1/6, P(X = 6) = 1/6 E(X) = 4 + 2^ + 3^+4 + 5^ + 6^ (10) 6 6 6 6 6 6 = 3.5 (11) * Střední hodnota počtu ok při hodu kostkou je 3.5. rozptyl DX: * D(X) = E([X - E{X)f) = Y^Jx - E{X)fP{x) * EX jsme vypočítali * E(X2) vypočteme podle vztahu E(Y) = E(g(X)) = 9Íx)p(x)i kde y = 9ÍX) = X2 E(X2) = l2- + 22- + 32- + 42- + 52- + 62-6 6 6 6 6 6 = 15.1 * DX = E(X2) - (EX)2 = 15.1 - 3.52 = 2.917. * Rozptyl počtu ok při hodu kostkou je 2.917. standardizovaná náh.veličina X_E(X) realizace st.náh.vel. jsou bezrozměrná čísla, která nám říkají o kolikanásobek směrodatné odchylky y^D(X) je ralizace X posunuta doprava/doleva od střední hodnoty E(X) = 0 a2 = 1 centrování, škálování, standardizace 5 Kovariance C (X, Y) • vždy mezi dvěmi náh.veličinami X,Y • disrkétní náhodná veličina: C(X,Y) = E([X — EX][Y — EY]) = oo oo Y,YM-EX^y-EY^p^y) -oo —oo kde p(x, y) je simultánni pstní fce. spojitá náhodná veličina C (X,Y) = E([X - EX][Y - EY]) oo roo [x-EX][y-EY]f(x,y)dx, oo J —oo kde f (x,y) je simultánni hustota • střední hodnota součinu centrovaných náh.veličin X,Y • znaménko kovariance určuje, zda je vztah mezi náh.veličinami přímý nebo nepřímý Korelace • dvou náh.veličin X, Y • střední hodnota součinu standardizovaných veličin X,Y • charakterizuje těsnost LINEÁRNÍHO vztahu mezi laľ Rixx) = E'x-EXY-EY^ C(A'y> VĎX VĎY J y/ĎX^/DY 6 • Příklad: Na pohřebišti se našlo několik koster, které pravděpodobně patřili obětem uctívacích rituálů. Kostrám chybí vždy na rukou buď jeden nebo dva prsty a na nohou tři nebo čtyři prsty. Máme dva znaky: Znak X - chybějící prsty na rukou má dvě varianty (X\ - 1 prst; X2 - 2prsty). Znak Y - chybějící prsty na nohou má také dvě varianty (Yľ - 3prsty; Y2 - 4prsty). Pst kombinace R1+N3 je 0.1, pst kombinace R1+N4 je 0.3, pst kombinace R2+N3 je 0.35 a kombinace R2+N4 je 0.25. Určete kovarianci a korelaci znaků laľ. Data můžeme uspořádat do přehledné tabulky: 0.1, 0.3, 0.35 a 0.25 jsou simultánní psti p(xi, íjj). N3 N4 p(x) Rl R2 0.1 0.3 0.35 0.25 0.4 0.6 p(y) 0.45 0.55 1 00 00 c(x, n = E I> - EX^ - EY^x> y) -00 —00 EX = 1 * 0.4 +2* 0.6 = 1.6 EY = 3 * 0.45 + 4 * 0.55 = 3.55 C(X, Y) = (1 - 1.6)(3 - 3.55)0.1 + (1 - 1.6)(4 - 3.55)0.3+ + (2 - 1.6)(3 - 3.55)0.35 + (2 - 1.6)(4 - 3.55)0.25 = 0.33 * 0.1 - 0.27 * 0.3 - 0.22 * 0.35 + 0.18 * 0.25 -0.0É E{X2) = l20.4 + 220.6 = 2.8 E(Y2) = 320.45 + 420.55 = 12.85 DX = E(X2) - (EX)2 = 2.8 - 1.62 = 0.24 DY = E(Y2) - (EY)2 = 12.85 - 3.552 - 1.62 0.2475 R(X,Y) C(X,Y) /ĎXVTŤY -0.05 yÔ24V0.2475 -0.325 7