Procvičovací úkol č.7 - Zadání Stará látka: Příklad č.l: Náhodná veličina X udává počet ok při hodu kostkou. Stanovte hodnoty pravděpodobnostní funkce a vypočítejte střední hodnotu a rozptyl náhodné veličiny X. EX=3.5, DX=2.917 Nová látka: Příklad č.l: Pět mužů zjistilo a zapsalo svou hmotnost (v kg) a výšku (v cm): Číslo muže 1 2 3 4 5 Hmotnost Výška 76 86 73 84 79 170 177 169 174 175 1. Najděte pomocí R nestranné bodové odhady (a) střední hodnoty hmotnosti a střední hodnoty výšky 173 cm; 79.6 kg (b) rozptylu hmotnosti a rozptylu výšky 29.3; 11.5 (c) kovariance hmotnosti a výšky. 16.5 2. Najděte pomocí R asymptotický bodový odhad koeficientu korelace hmotnosti a výšky. Výslednou hodnotu interpretujte. 0.8989; Vysoký stupeň/Velmi vysoký stupeň lineární závislosti. 3. Vytvořte a řádně popište histogramy pro hmotnost a výšku. Do každého histogramu zaznamenejte také křivku hustoty normálního rozložení s parametry fi =výběrový průměr, a2 =výběrový rozptyl. 4. Otestujte normalitu obou náhodných výběrů (pro každý náhodný výběr udělejte samostatný test) vhodným testem normality. Uveďte, proč jste zvolili vámi vybraný test jako nejvhodnější. !! Nezapomeňte napsat závěr vašeho testování (rozhodnutí o zamítnutí/nezamítnutí H0) !! 1 Příklad č.2: Z populace stejně starých selat téhož plemene bylo vylosováno šest selat a po dobu půl roku jim byla podávána táž výkrmná dieta. Byly zaznamenávány průměrné denní přírůstky hmotnosti v Dg. Z dřívějších pokusů je známo, že v populaci mívají takové přírůstky normální rozložení, avšak střední hodnota i rozptyl se měnívají. Přírůstky v Dg: 62, 54, 55, 60, 53, 58. (a) Najděte 95% empirický levostranný interval spolehlivosti pro neznámou střední hodnotu fi. (54.06; oo) (b) Najděte 95% empirický interval spolehlivosti pro rozptyl a2. (4.987; 76.913) Výsledky řádně interpretujte a vždy okomentujte, proč jste k výpočtu zvolili vámi vybraný IS. Příklad č.3: 1. U 48 studentek VŠE v Praze byla zjišťována výška a obor studia (1 - národní hospodářství, 2 - informatika). Hodnoty jsou uloženy v souboru vyska.txt. Pomocí Q-Q grafu posuďte vizuálně předpoklad normality. Na hladině významnosti a = 0.05 testujte hypotézu, že data pocházejí z normálního rozložení. Hypotézu otestujte pomocí (a) Lillieforsovy modifikace K-S testu; (b) Shapirova-Wilkova testu; (c) Andersonova-Darlingova testu. !! Nezapomeňte napsat závěr vašeho testování (rozhodnutí o zamítnutí/nezamítnutí H0) !! 2 Lilliefors (Kolmogorov-Smirnov) normality test data: vyska D = 0.1556, p-value = 0.005258 #------------------------------------------------------ Shapiro-Wilk normality test data: vyska W = 0.966, p-value = 0.176 #------------------------------------------------------ Anderson-Darling normality test data: vyska A = 0.661, p-value = 0.07933 2. Testy normality a grafické ověření normality proveďte samostatně a) pro výšky studentek oboru národní hospodářství, b) pro výšky studentek oboru informatiky. Příklad č.4 - Dobrovolný :) Vyjděte z pivotovy statistiky T = —-— a odvoďte tvar pro 100(1 — a)% oboustranný interval spolehlivosti. Postup je analogický postupu uvedenému na hodině. Odvození proveďte ručně a napište mi postup odvození. Nápověda: • Není-li uveden typ intervalu, je tím myšlen interval oboustranný. 3