6 Výpočet číselných charakteristik náhodných veličin, aplikace Moivreovy — Laplaceovy věty • F (x), p(x), f (x) ... funkcionální charakteristiky — obsahují veškerou informaci o chování náh.veličiny • někdy nás zajímají pouze rysy chování náh.veličiny —> číselné charakteristiky — kvantily (^0.25, ^o.s, ^0.75, apod.) — střední hodnota — rozptyl / směrodatná odchylka — kovariance — korelace Kvantily vybraných spojitých rozdělení; a-kvantil • a-kvantil náh.veličiny X . . . xa • obdoba a-kvantilu v popisné statistice • křivka hustoty: — plocha pod křivkou ... pst ... = 1 — tuto plochu rozdělíme na 2 části * tmavá plocha a * světlá plocha 1 — a • tt-kvantil ... číslo, takové, že Pr(X < • pst, že náhodná veličina X je menší nebo rovna xa je rovna a • speciální kvantily — medián ... rr0.5 — l.kvartil ... x025 — 3.kvartil ... rco.75 • Standardizované normální rozdělení — * X ~ ÍV(0,1) * a-kvantil ... u(a) * symetrické ... u(a) = —u(l — a) 1 * qnorm(alpha) • x2 rozdělení s n stupni volnosti — (Pearsonovo rozdělení) — X ~ x2 (n) — a-kvantil ... Xnia) — nesymetrické — qchisq(alpha,n) • Studentovo rozdělení s n stupni volnosti — X ~ t(n) — a-kvantil ... ín(a) — symetrické ... tn(a) = —tn(l — a) — qt(alpha,n) • Fisherovo rozdělení s nx a n2 stupni volnosti — (Fisherovo-Snedecorovo rozdělení) — X ~ F(n1,n2) — a-kvantil ... Fnun2(a) — nesymetrické, ale Fríl.„2(a) = —-)--- — qf(alpha, nl, n2) Příklad 6.1. Najděte medián a horní a dolní kvartil náhodné veličiny U ~ ÍV(0,1). qnorm(0.5) qnorm(0.25) qnorm(0.75) Příklad 6.2. Najděte dolní kvartil náhodné veličiny X ~ N(3, 5). qnorm(0.25, 3, sqrt(5)) Příklad 6.3. Určete kvantil x|5(0.025). qchisq (0.025 , 25) Příklad 6.4. Určete kvantily í30(0.99) a ŕ14(0.05). qt(0.99, 30) qt(0.05, 14) Příklad 6.5. Určete kvantily F5,2o(0.975) a F2,10(0.05). qf(0.975, 5,20) qf(0.05, 2,10) 2 Střední hodnota EX, /i • 'idealizovaný' průměr • diskrétní náhodná veličina —y oo EX = xp(x) —oo • diskrétní transformovaná náhodná veličina —y oo E(Y) = E(g(X)) = Y,g(x)p(x) oo • náh. veličina X nemusí mít EX • Vlastnosti 1. E (a) = a 2. E (a + bX)=a + bE(X) 3. E(Xt + X2) = EXX + EX2 Rozptyl D(X), a2 • jakou má náh. vel. X tendenci realizovat se poblíž/daleko centrální polohy DX = E([X - EX]2) • diskrétní náh. veličina oo DX = E([X - EX}2) = ^2[x - EX]2p(x) —oo • čím více se hodnoty v souboru navzájem liší, tím je hodnota rozptylu vyšší • V DX ... směrodatná odchylka • Vlastnosti 1. D(X) = E(X2) - (EX)2 2. D(á) = 0 3. D (a + bX) = b2D(X) 4. Xi, X2 stoch.nezáv -> D{X1 + X2) = D{X1) + D(X2) Příklad 6.6. Náhodná veličina X udává počet ok při hodu kostkou. Vypočtěte její střední hodnotu a rozptyl. • X ... diskrétní n.v. —y E(X) = X^oo xp(x) potřebujeme p(x) pro x = 1,... x = 6 3 P (X = 1) = 1/6, P (X = 2) = 1/6, P (X = 3) = 1/6, P(X = 4) = 1/6, P(X = 5) = 1/6, P (X = 6) = 1/6 , N 111111 = 1- + 2- + 3- + 4- + 5- + 6- = 3.5 6 6 6 6 6 6 DX = Y^jX-EXfP{x) DX = (1 - 3.5)2± + (2 - 3.5)2i + (3 - 3.5)2± + (4 - 3.5)2^ + (5 - 3.5)2^ + (6 - 3.5)2^ 6 6 6 6 6 6 6.25 2.25 0.25 0.25 2.25 6.25 =--1---1---1---1---1--= 2.917 6 6 6 6 6 6 DX = E(X2) - (EX)2 — EX máme; E(X2) vypočteme podle: E (Y) = E (g (X)) = g(x)p(x), kde Y = g (X) = X2 E(X2) = l2- + 22- + 32- + 42- + 52- + 62-6 6 6 6 6 6 = 15.1 - DX = E(X2) - (EX)2 = 15.1 - 3.52 = 2.917. x <- 1:6 pi <- rep(l/6, 6) EX <- sum(x*pi) DX <- sum(x"2*pi)-EX"2 standardizovaná náh.veličina X — E(X) • centrování, škálování, standardizace Kovariance C (X, Y) • střední hodnota součinu centrovaných náh.veličin X,Y • diskrétni náhodná veličina: C(X,Y) = E([X — EX][Y — EY]) = oo oo —oo —oo kde p(x,y) je simultánní pstní fce. znaménko kovariance: + ... přímý; — ... nepřímý vztah 4 Korelace R(X, Y) • střední hodnota součinu standardizovaných veličin X,Y R(X,Y) = E'X-EXY-Ey^- C[XX) VĎX VĎY ) VĎXVĎY charakterizuje těsnost LINEÁRNÍHO vztahu mezi X a,Y 5 Objektem zájmu rozsáhlé studie bylo sledování pohřebního rituálu dnes již vymřelého ale v minulosti velmi dlouho přetrvávajícího a rozsáhlého jihoamerického kmene. Součástí pohřebního rituálu tohoto kmene bylo odsekávání článků prstů na rukou a nohou zemřelého a jejich následné obětování bohům jako dar, aby zemřelého přijali mezi sebe. Zemřelému tak byl na ruce odetnut buď jeden nebo dva prsty a na noze tři nebo čtyři prsty. Dále bylo zjištěno, že domorodci odtínali jeden prst na ruce a tři prsty na noze zemřelého s pravděpodobností 0.1, dva prsty na ruce a tři prsty na noze s pravděpodobností 0.3, jeden prst na ruce a čtyři prsty na noze s pravděpodobností 0.35 a dva prsty na ruce a čtyři prsty na noze s pravděpodobností 0.25. Určete korelaci znaků X - počet odetnutých prstů na rukou a Y - počet odetnutých prstů na nohou. 0.1, 0.3, 0.35 a 0.25 jsou simultánní psti p(xi,yj). Data můžeme uspořádat do přehledné tabulky: N3 N4 p(x) Rl R2 0.1 0.3 0.35 0.25 0.4 0.6 p(y) 0.45 0.55 1 R(X,Y) C(X, Y) y/ĎXy/ĎY — oo — oo EX = 1 *0.4 + 2*0.6 = 1.6 EY = 3* 0.45 + 4 * 0.55 = 3.55 C(X, Y) = (1 - 1.6)(3 - 3.55)0.1 + (1 - 1.6)(4 - 3.55)0.3+ + (2 - 1.6)(3 - 3.55)0.35 + (2 - 1.6)(4 - 3.55)0.25 = 0.33 * 0.1 - 0.27 * 0.3 - 0.22 * 0.35 + 0.18 * 0.25 : E(X2) = l20.4 + 220.6 = 2.8 E(Y2) = 320.45 + 420.55 = 12.85 DX = E(X2) - (EX)2 = 2.8 - 1.62 = 0.24 DY = E(Y2) - (EY)2 = 12.85 - 3.552 - 1.62 -0.0É 0.2475 R(X,Y) C(X,Y) -0.05 VÔT24V0.2475 -0.328. x <- c( 1, 2) y <- c( 3, 4) n <- length(x) pi <- data.frame(Tri= c(0.1, 0.35), Ctyri= c (0.3, 0.25) , row.names=c('Jeden', 'Dva')) pix <- apply(pi, 1, sum) piy <- apply(pi, 2, sum) EX <- sum(x*pix) 6 EY <- sum(y*piy) DX <- sum(x"2*pix)-EX"2 DY <- sum(y"2*piy)-EY"2 CXY <- sum(c((x-EX)*(y-EY) [1] , (x-EX)*(y-EY) [2])*c(as.matrix(pi))) RXY <- CXY/(sqrt(DX)*sqrt(DY)) (Tab <- round(data.frame(EX=EX, EY=EY, DX=DX, DY=DY, CXY=CXY, RXY=RXY, row.names= 'Charakteristiky'), digits=4)) 6.1 Aplikace Moivrovy a Laplaceovy věty • Xi,... ,Xn jsou stochasticky nezáv. náh. veličiny, X\ ~ Alt(9),... Xn ~ Alt{9). Pak jejich součet Yn = Yľi=i Xi má binomické rozdělení Bin(n, 9). Střední hodnota veličiny Yn je EYn = n9, rozptyl DYn = n9(l — 9). Podle centrální limitní věty se standardizovaná náhodná veličina Yn — n9 — n = asymptoticky řídí standardizovaným normálním rozldělením Yn ~ ÍV(0,1). y/nO(l - 9) Příklad 6.11. Pravděpodobnost úspěchu při jednom pokusu je 0.3. S jakou pravděpodobností lze tvrdit, že počet úspěchů ve 100 pokusech bude v mezích od 20 do 40? Výpočet proveďte a) přesně; b) pomocí aproximace normálním rozložením. # a) sum(dbinom(20:40, 100, 0.3)) pbinom(40, 100, 0.3)-pbinom(19, 100, 0.3) # b) pnorm(40, 100*0.3, sqrt(100*0.3*0.7))-pnorm(19, 100*0.3, sqrt(100*0.3*0.7)) Příklad 6.10. Pravděpodobnost, že zakoupený elektrospotřebič bude vyžadovat opravu během záruční doby, je rovna 0.2. Jaká je pravděpodobnost, že během záruční doby bude nutno ze 400 prodaných spotřebičů opravit více než 96? Výpočet proveďte a) přesně; b) pomocí aproximace normálním rozložením. # a) l-pbinom(96, 400, 0.2) # b) l-pnorm(96, 400*0.2, sqrt(400*0.2*0.8)) 7