Zadání příkladů — Statistická inference II — 2017 Příklad 12. nezávislost /i a a2; pravděpodobnost pokrytí Nechť X ~ N(fi,a2), kde /i = 20 a a2 = 100. Pomocí simulační studie vypočítejte Pearsonův korelační koeficient rx s- Nakreslete šedou barvou rozptylový graf (im,sm), kde m = 1,2, ...,M, přičemž M = 5 000. Černou barvou vyznačte v grafu takové body (xm,sm), pro Xjn /j, které platí tw7 < íij_i(qí/2). Dále vykreslete hranice, které jsou definovány body (xm,sm), jež splňují vztah tyy,m = tn-i(a/2). Vypočítejte pravděpodobnost pokrytí 95% DIS pro jj, jako podíl ~^mI{tw,m < í„_i(a/2))/M. Zvolte (a) n = 5, (b) n = 50 a (c) n = 100. Simulaci proveďte také za předpokladu, že data pochází ze smíšeného rozdělení X ~ \pN(fi, a'f) + (1 —p)N(fi, u'^)], kde p = 0.9, fj, = 20, of = 100 a a\ = 400. ## n ## aktuálni pst.pokryti 0.952 ## nominálni pst.pokryti (spolehlivost) 0.950 ## n ## aktuálni pst.pokryti 0.958 ## nominálni pst.pokryti (spolehlivost) 0.950 Pravděpodobnost pokryti N=5, r=0.0175 Pravděpodobnost pokryti N=5, r=0.0048 ## n ## aktuálni pst.pokryti 0.958 ## nominálni pst.pokryti (spolehlivost) 0.950 ## n ## aktuálni pst.pokryti 0.9425 ## nominálni pst.pokryti (spolehlivost) 0.9500 1 Pravděpodobnost pokryti Pravděpodobnost pokryti N=50, r=0.0059 N=50, r=0.0337 0 10 20 30 40 0 10 20 30 40 ## n ## aktuálni pst.pokryti 0.946 ## nominálni pst.pokryti (spolehlivost) 0.950 ## n ## aktuálni pst.pokryti 0.942 ## nominálni pst.pokryti (spolehlivost) 0.950 Pravděpodobnost pokryti N=100, r=0.0126 Pravděpodobnost pokryti N=100, r=0.0319 2 Příklad 13. konvergence p a £ k normálnímu rozdělení 1. Proveďte simulaci pseudonáhodných čísel z N'z{^, S), kde yui = 0, /i2 = 0, cri = 1, 02 = 1, M = 10 000, r/io = 0.8. Pro každé m = 1,2,..., M, vypočítejte realizaci výběrového korelačního koeficientu rm a Fisherovy Z-proměnné zn^m. Zobrazte histogramy simulovaných rm a z^m a superponujte je teoretickými hustotami příslušných normálních rozdělení. Vytvořte animaci zobrazující rozdělení výběrového korelačního koeficientu R a Fisherovy Z transformace pro různé rozsahy náhodného výběru n € {5,10,..., 70}. Pearsonuv korel. koeficient - R n = 5, p = 0.8 oj o _ CO - oj I-1-1-1-1-1 0.5 0.6 0.7 0.8 0.9 1.0 P Fisherova Z-promenna - Zr n =5, p = 0.8 ^ - co - TO I-1-1-1-1-1 -0.5 0.0 0.5 1.0 1.5 2.0 Z, 2. Vytvořte animaci zobrazující rozdělení výběrového korelačního koeficientu R € {0.1, 0.2,..., 0.9} a Fisherovy Z transformace pro tyto různé korelační koeficienty. Animace vytvořte pro (a) n = 5, (b) n = 10, (c) n = 100. 3 Pearsonuv korel. koeficient - R n = 10, p = 0.1 o c\i Fisherova Z-promenna - Zr n = 10, p = 0.1 co H Pearsonuv korel. koeficient - R n = 50, p = 0.1 CM O _ CO - CO I-1-1-1-1-1 0.0 0.2 0.4 0.6 0.8 1.0 P Fisherova Z-promenna - Zr n = 50, p = 0.1 o co H LO OJ O OJ O LO W T- o LO Ö O -2-10 1 4 Příklad 14. Test o korelačním koeficientu p: Mějme data one-sample-correlation-skull-mf.txt a proměnné největší výška mozkovny skuli.pH a morfologická výška tváře face.H (obě v mm) starověké egyptské mužské populace, o kterých předpokládáme, že mají dvourozměrné normální rozdělení A^//, S). 1. Otestujte hypotézu o tom, že korelační koeficient největší výšky mozkovny a morfologické výšky tváře je rovný 0.251. 2. Vypočítejte 100 x (1 — a)% empirický DIS pro korelační koeficient, kde koeficient spolehlivosti 1 — a = 0.95. Použijte (a) Waldovu testovací statistiku Zyy', (b) testovací statistiku poměrem věrohodnosti Ulr- 1 0.1 1 1 1 1 1 0.2 0.3 0.4 0.5 0.6 p test.statistika W kritický obor p-hodnota Waldův přístup 1.104799 (-oo, -1.959964) U (1.959964; oo) (0.1868617,0.4605561) 0.2692467 Věrohodnostní přístup 1.241757 (3.841459; oo) (0.1880626,0.4590998) 0.2651328 5 Příklad 15. Rozdělení testovacích statistik F, Uwi U s a Ulr jednovýběrového testu o rozptylu a2 Pomocí simulační studie ověřte, že • statistika F ■■ nS2n Au n 1 n = 2 l v -^obs n f ■^obs = 2 l n • statistika Uw = — I--1 ~ x (1) 2 2/ 2 1 ~x2(i) • statistika [7ljí = F0bs — n yl + ln ^-J J ~ x (1) • Vygenerujte M = 1000 pseudonáhodných výběrů o rozsahu n = 5. Pro každý náhodný výběr vypočítejte hodnoty realizací testovacích statistik F, Uw, Us a Ulr- Vytvořte histogramy těchto testovacích statistik a superponujte je křivkami příslušného rozdělení. • Vytvořte animaci, pomocí které bude zřejmé, jak se s rostoucím n rozdělení testovacích statistik F, Uw, Us a Ulr asymptoticky blíží k příslušnému rozdělení. Animaci spravte pro měnící se n € {3, 4, 5,10,15, 20, 25, 30, 35, 40,45, 50,60, 70, 80, 90,100, 200, 300,400, 500, 600,700, 800, 900,1000} 6 Příklad 16. Pokračování příkladu 15 • Vygenerujte M = 1000 pseudonáhodných výběrů o rozsahu n = 5. Pro každý náhodný výběr stanovte hodnoty realizací testovacích statistik F, Uw, Us a Ulr- Pomocí funkce density() vypočítejte jádrové odhady rozdělení testovacích statistik Uw, Us a Ulr- Tyto jádrové odhady zobrazte do jednoho grafu a barevně je odlište. Do grafu dokreslete křivku hustoty \2 rozdělení o jednom stupni volnosti a vertikální referenční čáru v hodnotě 0. • Vytvořte animaci, pomocí které bude zřejmé, jak se s rostoucím n rozdělení testovacích statistik Uw, U s a Ulr asymptoticky blíží k X2(l) rozdělení. Animaci spravte pro měnící se n € {3, 4, 5,10,15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80,90,100, 200, 300,400, 500, 600, 700, 800, 900,1000} 7