5 Spojité náhodné veličiny 5.1 Normální rozdělení N(/i, a2) • X\,..., Xn ... nezávislé náhodné veličiny • Normální rozdělení - X ~ N(fi,a2) — hustota f (x) = —-e 2.2 a; e R. - vlastnosti: E [X] = fi; Var [X] = a2 — dnorm(x, mu, sigma), pnorm(x, mu, sigma), qnorm(alpha, mu, sigma) • Standardizované normální rozdělení - X ~ N(0,1) — hustota f (x) = (x) = — vlastnosti: E[X] = 0; Var[X] = 1 — dnorm(x), pnorm(x), qnorm(alpha) • Vlastnosti normálního rozdělení — Věta 1: Nechť X\,...,Xn jsou nezávislé náhodné veličiny z normálního rozdělení N(fi,a2). Potom náhodná veličina Xn = ^ y^ii=i -^i ~ N (jj,, Příklad 5.1. Výpočet parametrů jj, a a normálního rozdělení Mějme datový soubor 17-anova-newborns-2.txt obsahujícího údaje o porodní hmotnosti novorozenců v jedné okresní nemocnici za období jednoho roku (Alanova, 2008). Za předpokladu, že náhodná veličina X popisující porodní hmotnost novorozenců pochází z normálního rozdělení N(fi, a2) odhadněte parametr střední hodnoty /i a rozptylu a2. Finální rozdělení porovnejte s naměřenými údaji. Řešení příkladu 5.1 edu . M prch.N sex . C we ight . C we ight . K 1 2 0 m 3470 2 2 2 0 m 3240 2 3 2 0 f 2980 2 6e-04 5e-04 4e-04 é 3e-04 2e-04 le-04 0e+00 775 1575 2375 3175 3975 4775 pôrodní hmotnost (v g) Interpretace výsledků: Náhodná veličina X popisující porodní hmotnost novorozenců pochází z normálního rozdělení se střední hodnotou /i =....................a rozptylem a2 =...................., tj. X ~ N(....................; ....................). ★ 1 Příklad 5.2. Výpočet pravděpodobností na základě normálního rozdělení Za předpokladu, že porodní hmotnost novorozenců pochází z normálního rozdělení 7V(3078.027, 6962), vypočítejte pravděpodobnost, že porodní hmotnost novorozence bude (a) menší než 3800 g; (b) v rozmezí 2500-4200 g; (c) větší než 4000 g, (d) rovná 2100 g. Řešení příkladu 5.2 [1] 0 8502061 [1] 0 7433938 [1] 0 09263967 Interpretace výsledků: Pravděpodobnost, že porodní hmotnost novorozenců bude menší než 3800 g, je................ ................................%. Pravděpodobnost, že porodní hmotnost novorozenců bude v rozmezí 2500-4200 mm, je .....................%. Pravděpodobnost, že porodní hmotnost novorozenců bude větší než 4000 mm, je.........................%. Pravděpodobnost, že porodní hmotnost novorozenců bude rovná 2100 g, je .............................%, protože data pochází z normálního rozdělení, což je...................................typ rozdělení, proto Pr(X = 2100) =.......................... ★ Příklad 5.3. Výpočet pravděpodobností na základě normálního rozdělení Za předpokladu, že porodní hmotnost novorozenců pochází z normálního rozdělení 7V(3078.027, 6962), vypočítejte pravděpodobnost, že průměrná porodní hmotnost pěti novorozenců bude (a) menší než 3800 g; (b) v rozmezí 2500-4200 g; (c) větší než 4000 g; (d) rovná 2100 g. Řešení příkladu 5.3 [1] 0 9898164 [1] 0 9681918 [1] 0 001527937 Interpretace výsledků: Pravděpodobnost, že průměrná porodní hmotnost pěti novorozenců bude menší než 3800 g je .........................%. Pravděpodobnost, že průměrná porodní hmotnost pěti novorozenců bude v rozmezí 2500-4200 g je .........................%. Pravděpodobnost, že průměrná porodní hmotnost pěti novorozenců bude větší než 4000 g je .........................%. Pravděpodobnost, že průměrná porodní hmotnost pěti novorozenců bude rovná 2100 g je .........................%, protože data pochází z normálního rozdělení, což je ......................... typ rozdělení, proto Pr(X = 2100) =.......................... ★ Příklad 5.4. Graf hustoty a distribuční funkce normálního rozdělení Nakreslete graf hustoty a distribuční funkce náhodné veličiny X ~ 7V(3078.027, 6962) popisující porodní hmotnost jednoho novorozence a porovnejte je s křivkami hustoty a distribuční funkce náhodné veličiny X ~ 7V(3078.027, ^-) popisující průměrnou porodní hmotnost pěti novorozenců. Řešení příkladu 5.4 n-1-1-1-1— n-1-1-1-r 1000 2000 3000 4000 5000 1000 2000 3000 4000 5000 2 5.2 Dvourozměrné normální rozdělení N2(/x, E) • (Xi, Y"i)T,..., (Xn, Yn)T ... dvojice nezávislých stejně rozdělených náhodných veličin • (X, Y)T ... dvourozměrný náhodný vektor - (X,r)T~N2(M,£) * [i = (/Líi, /i2)T • • • vektor středních hodnot .2 * S = ( 171 ŕ10"10"2 j _ í "i ^i2 j varianční matice pcriO-2 0"2 / \aV2 of — 6 = (p1,fi2,(?í,(?2,p)Ti kde Mi>M2 e R> 0-1,0-2 > o, p € (-1; 1) — hustota f(x,y) = - e ^^K^T "i" ~ — vlastnosti E[(X,F)T] = Var[(X,r)] = S — marginální rozdělení X ~ N(/j,\, a'(), Y ~ N(fi2, o"|). • Grafická vizualizace dat — dvourozměrný tečkový diagram superponovaný konturovým diagramem — 3D-graf Dataset: 03-paired-means-clavicle2.txt Datový soubor 03-paired-means-clavicle2.txt obsahuje osteometrické údaje o délkách klíčních kostí na pravé a levé straně těla v párovém uspořádání. Data pochází z anglického souboru dokumentovaných skeletů (Parsons, 1916). Popis proměnných v datasetu: • id ... ID jedince; • sex ... pohlaví jedince (m - muž, f - žena); • length.L ... délka levé klíční kosti (v mm); • length.R ... délka pravé klíční kosti (v mm). Příklad 5.5. Výpočet parametrů [i a S dvourozměrného normálního rozdělení Načtěte datový soubor 03-paired-means-clavicle2.txt. Nechť náhodná veličina X popisuje délku levé klíční kosti a náhodná veličina Y popisuje délku pravé klíční kosti u mužů. Pomocí tečkového diagramu vizualizujte vztah délky levé a pravé klíční kosti. Za předpokladu, že data pochází z dvourozměrného normálního rozdělení (X, Y)T ~ N2(/i, S) odhadněte hodnoty parametrů /ii, /i2, cr'i, a\ a p a stanovte tvar vektoru středních hodnot a varianční matice. Řešení příkladu 5.5 id sex length.R length.L 1 66 m 126 130 2 69 m 158 159 3 71 m 153 151 4 72 m 145 147 3 170 160 150 140 130 n-1-T 130 140 150 160 170 délka leve klicni kosti (v mm) mí ían sd rho leva strana 153 60 9 9468 0 9371 pravá strana 151 74 10 9969 0 9371 16 17 18 Interpretace výsledků: Náhodný vektor (X, Y)T popisující délku klíční kosti z levé a pravé strany u mužů pochází z dvourozměrného normálního rozdělení s vektorem středních hodnot {i = (pi, p2)T, kde p\ =...............................mm a uo = ...............................mm a s varianční maticí £ = ( ^ f)(J^'Z \ ^e _ ...............................mm, \paia2 a?2 J' a2 =...............................mm a p = ................................ Délka klíční kosti z levé strany u mužů pochází marginálně z normálního rozdělení se střední hodnotou p\ =........................ mm a směrodatnou odchylkou a\ = ..........................mm. Délka klíční kosti z pravé strany u mužů pochází marginálně z normálního rozdělení se střední hodnotou p2 = ........................nim a směrodatnou odchylkou a2 =..........................mm. Příklad 5.6. Parametrické a neparametrické odhady dat z N2{^, S) Načtěte datový soubor 03-paired-means-clavicle2.txt. Za předpokladu, že náhodný vektor (X, Y)T popisující délku klíční kosti z levé a pravé strany u mužů pochází z dvourozměrného normálního rozdělení, tj. (X, Y)T ~ N2(^jl, S) s odhadem středních hodnot pi = 153.6, p2 = 151.74, rozptylů a'f = 9.952 a a'2 = ll2 a odhadem korelačního koeficientu p = 0.9371. a. sestrojte tečkový diagram délky klíční kosti z levé a pravé strany superponovaný teoretickými konturami teoretického dvourozměrného normálního rozdělení; b. sestrojte tečkový diagram délky klíční kosti z levé a pravé strany superponovaný konturami jádrového odhadu hustoty; c. sestrojte 3D-diagram hustoty teoretického dvourozměrného normálního rozdělení délky klíční kosti z levé a pravé strany; d. sestrojte 3D-diagram jádrového odhadu hustoty délky klíční kosti z levé a pravé strany. 4 Řešení příkladu 5.6 130 140 150 160 170 130 140 150 160 170 délka leve klicni kosti (v mm) délka leve klicni kosti (v mm) Obrázek 1: Dvourozměrný tečkový diagram délky klíční kosti z levé a pravé strany superponovaný konturami (a) teoretické hustoty (vlevo); (b) jádrového odhadu hustoty dvourozměrného normálního rozdělení (vpravo) Obrázek 2: 3D diagram (a) teoretické hustoty; (b) jádrového odhadu hustoty (vpravo) dvourozměrného normálního rozdělení Interpetace výsledků: Na základě grafické vizualizace předpokládáme, že data pochází / nepochází z dvourozměrného normálního rozdělení. Poznámka: Hodnocení normality na základě grafické vizualizace je pouze subjektivním hodnocením. V sedmém cvičení budeme normalitu, případně dvourozměrnou normalitu, náhodného výběru posuzovat objektivně, a to na základě testů normality. 5