5 Pravděpodobnostní funkce, hustoty a distribuční funkce, výpočet pravděpodobností pomocí distribučních funkcí • experiment složený z opakování jednoho náhodného pokusu stále dokola • provedu pokus —y hodím kostkou —y nastane jev • pravděpodobnost = jak velká je naděje, že daný jev nastane • náhodná veličina X ... zobrazení ze základního prostoru do množiny reálných čísel — podle dat dělíme náhodné veličiny na diskrétní a spojité • diskrétní — pstní fce p(x) * P(X = x) — distribuční fce F(x) * P(X < x) 5.1 Binomické rozdělení Bin(n, 9) • X ~ Bm(n,d) • X... počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu v každém pokusu je vyjádřena pomocí parametru 9. Příklad 5.1. Nakreslete graf pravděpodobnostní funkce a distribuční funkce náhodné veličiny X ~ Bin(6,0.5). #graf pravděpodobnostní funkce x <- 0:6 px <- dbinom(x, size=6, prob=0.5) plot(x, px , type='h', main='X~Bin(6 , 0.5) ' , ylab='pravdepodobnostniufunkce' , xlab = 'x ' ) points(x, px, col='red', pch=19, cex=0.8) #graf distribuční funkce Fx <- pbinom(x, size=6, prob=0.5) n <- length(Fx) plot(x, Fx, type='n', main='X~Bin(6,0.5)', ylab='distribucniufunkce', xlab='x', xlim = c(-1,n) , ylim = c(0 , 1)) segments(x, Fx, x+1, Fx) arrows(0, 0, -1, 0, length=0.l) arrows(n-1 ,1, n, 1, length = 0.l) points(x, Fx, col='red', pch=19, cex=0.8) points(x, c(0, Fx [-n]) , col='red', bg='white', pch=21, cex=0.8) 1 5.2 Poissonovo rozdělení Po(A) • X ... udává počet událostí, které nastanou v jednotkovém časovém intervalu (resp. v jednotkové oblasti), přičemž k událostem dochází náhodně, jednotlivě a vzájemně nezávisle. Parametr A > 0 je střední počet těchto událostí. • počet zákazníků, kteří vešli do pekárny za jeden den • počet tramvají, které přijeli na zastávku za půl hodiny • A > 0; EX = X; DX = X • dpois(x, lambda) • ppois(x, lambda) Příklad 5.3. Při provozu balicího automatu vznikají během směny náhodné poruchy, které se řídí rozdělením Po(2). Jaká je pravděpodobnost, že během směny dojde k alespoň jedné poruše? l-dpois(0, lambda=2) l-ppois(0, lambda=2) 5.3 Spojitá náhodná veličina • nabývají lib. hodnoty z daného intervalu • změříme výšku člověka: — pst, vybraný člověk bude měřit 140-145 cm Pr(140 cm < X < 145 cm) — pst, vybraný člověk bude vyšší než 170 cm Pr(X > 170 cm) • hustota f(x) — pravděpodobnost realizace X v libovolném intervalu I se dá vyjádřit jako plocha pod • X ~ Po(A). • pstní fce křivkou hustoty f(x) (2) Pr(X = x) = 0 ... plocha pod bodem je čára a obsah je tedy 0. f(x) > 0 ; plocha pod celou křivkou hustoty = 1 Gaussova křivka hustoty 2 • distribuční funkce F (x) analogie distribuční funkce v diskrétním případě F (x) = Pr(X < x) Pr(X < x) = f*^ f(t)át — F{x) .. .pst, že náhodná veličina X nepřekročí hodnotu x — Pr(X > x) = Pr(X > x) = 1 - Pr(X < x) = 1 - Pr(X < x). • spojité náhodné veličiny se řídí spojitým rozdělením — Exponenciální Ex{\) — Normální N(fi, a2) — Standardizované normální N(0,1) — odvozeniny od N(0,1) 5.4 Exponenciální rozdělení Exp(A) • X... udává dobu čekání na příchod nějaké události, která se může dostavit každým okamžikem se stejnou šancí bez ohledu na dosud pročekanou dobu. Přitom j vyjadřuje střední hodnotu doby čekání. • doba potřebná k obsloužení zákazníka • doba během níž přijede tramvaj na zastávku bez ohledu na dobu, kdy přijela poslední tramvaj • náhodná veličina X ~ Ex{\) * Chi-kvadrátové x2 {n) * Studentovo t (n) * Fisherovo-Snedecorovo F(ni, n2) • hustota (3) . A>0; E(X) = {,D(X) • f (x) ... dexp(x, lambda) _ j_ — A2 • F (x) ... pexp(x, lambda) 3 Příklad 5.4. Nakreslete graf hustoty a distribuční funkce náhodné veličiny X ~ Exp(2). #graf hustoty x <- seq(from=0, to=2.5, length=512) fx <- dexp(x, rate=2) plot(x, fx , type='l', main='X~Exp(2)', xlab='x', col='red') #graf distribuční funkce Fx <- pexp(x, rate=2) plot(x, Fx, main='X~Exp(2)', xlab='x', ylab='distribucniufunkce', type='l', col=' red ' ) Příklad 5.5. Doba do ukončení opravy v opravně obuvi je náhodná veličina, která se řídí exponenciálním rozdělením se střední dobou opravy 3 dny. Jaká je pravděpodobnost, že oprava bude ukončena do dvou dnů? pexp(2, rate=l/3) 5.5 Normální rozdělení N(/i, a2) • nejpoužívanější ze všech rozložení • X ~ N(ii,a2) • hustota /(*) • E(X) = fi- D(X) = a2. standardizované normální rozložení • p = 0, a2 = 0 • X ~ N(0,1) • hustota: • distribuční funkci ÍV(0,1) značíme • normální rozdělení je symetrické okolo nuly —y $(—x) = 1 — (platí jen pro ÍV(0,1). • f(x) ... dnorm(x, /i, \fa2) • F(x) ... pnorm(x, /i, \fa2) Vlastnosti normálního rozložení • Pokud X ~ N(/i,a2), potom X ~ ^ ^ JV(0,1) a • Pokud X ~ N(fi, a2), potom Y = a + bX ~ N (a + bfi, b2a2) a (4) 4 Příklad 5.7. Nakreslete graf hustoty a distribuční funkce náhodné veličiny X ~ N{—1,2). #graf hustoty x <- seq(from=-5, to=3, length=512) fx <- dnorm(x, mean=-l, sd=sqrt(2)) plot(x, fx , type='l', main = bquote(paste('XU~UN(u' , mu, '= -1,u' ,sigma"2, '=2U) ')) , xlim=c(-4.5,2.5), col=;red') #graf distribuční funkce Fx <- pnorm(x, mean=-l, sd=sqrt(2)) plot(x, Fx, type='l', main=bquote(paste('XU~UN(umu,'=-1,usigma~2=2U)')), xlim=c(-4.5,2.5), ylab='distribucniufunkce', col='red') Příklad 5.9. Životnost baterie v hodinách je náhodná veličina, která má normální rozdělení se střední hodnotou 300 hodin a směrodatnou odchylkou 35 hodin. Jaká je pravděpodobnost, že náhodně vybraná baterie bude mít životnost a) alespoň 320 hodin? b) nejvýše 310 hodin? a) Pr(X > 320) = Pr(X > 320) = l-Pr(X < 320) = l-Pr(X < 320) = 1-Pr \ < 3"(' ~ '' 'a2 v a2 1 _ Pr (y < 320353°°) = 1 - $(0.5714286) l-pnorm(320, mean=300, sd=35) 1-pnorm((320-300)/35, mean=0, sd=l) b) Pr(X < 310) = Pr(X < 310) pnorm(310, mean=300, sd=35) Pro zajímavost: ( Nedělali jsme na hodině ) Příklad 5.11. Nakreslete graf hustoty dvourozměrného standardizovaného normálního rozložení, source(;AS-funkce.R') x <- seq(from=-3, to=3, length=40) y <- seq(from=-3, to=3, length=40) nx <- length(x) ny <- length(y) z <- matrix(NA, nrow=nx, ncol=ny) f or ( i in 1 : nx ) { f or ( j in 1 : ny ) { z[i,j] <- norm2(x[i], y[j], mul=0, mu2=0, sigmal=l, sigma2=l) } > color <- terrain.colors( 12) 5 stredy <- (z[-l, -1] + z[-l, -ncol(z)] + z[-nrow(z), -1] + z[-nrow(z), -ncol( z)])/4 stredy.col <- cut(stredy , 12) persp(x, y, z, col = color [stredy.col] , phi = 30, theta = -45) 6