Zadání příkladů — Statistická inference II — 2017 Příklad 12. nezávislost /i a a2; pravděpodobnost pokrytí Nechť X ~ N(fi,a2), kde /i = 20 a a2 = 100. Pomocí simulační studie vypočítejte Pearsonův korelační koeficient rx s- Nakreslete šedou barvou rozptylový graf (im,sm), kde m = 1,2, ...,M, přičemž M = 5 000. Černou barvou vyznačte v grafu takové body (xm,sm), pro které platí ívK,m =~ < íij_i(qí/2). Dále vykreslete hranice, které jsou definovány body (xm,sm), jež splňují vztah tyy,m = tn-i(a/2). Vypočítejte pravděpodobnost pokrytí 95% DIS pro jj, jako podíl ~^mI{tw,m < í„_i(a/2))/M. Zvolte (a) n = 5, (b) n = 50 a (c) n = 100. Simulaci proveďte také za předpokladu, že data pochází ze smíšeného rozdělení X ~ \pN(fi, a'f) + (1 —p)N(fi, u'^)], kde p = 0.9, fj, = 20, of = 100 a a\ = 400. ## n ## aktuálni pst.pokryti 0.946 ## nominálni pst.pokryti (spolehlivost) 0.950 ## n ## aktuálni pst.pokryti 0.95 ## nominálni pst.pokryti (spolehlivost) 0.95 Pravděpodobnost pokryti Pravděpodobnost pokryti N=5, r=-0.0051 N=5, r=0.0119 0 10 20 30 40 0 10 20 30 40 ## ## aktuálni pst.pokryti ## nominálni pst.pokryti ## ## aktuálni pst.pokryti ## nominálni pst.pokryti n 0.958 (spolehlivost) 0.950 n 0.9525 (spolehlivost) 0.9500 1 Pravděpodobnost pokryti N=50, r=-0.0138 Pravděpodobnost pokryti N=50, r=-0.0263 ## n ## aktuálni pst.pokryti 0.961 ## nominálni pst.pokryti (spolehlivost) 0.950 ## n ## aktuálni pst.pokryti 0.946 ## nominálni pst.pokryti (spolehlivost) 0.950 Pravděpodobnost pokryti N=100, r=-0.07 Pravděpodobnost pokryti N=100, r=-0.0421 2 Příklad 13. konvergence p a £ k normálnímu rozdělení 1. Proveďte simulaci pseudonáhodných čísel z N'z{^, S), kde yui = 0, /i2 = 0, cri = 1, 02 = 1, M = 10 000, r/io = 0.8. Pro každé m = 1,2,..., M, vypočítejte realizaci výběrového korelačního koeficientu rm a Fisherovy Z-proměnné zn^m. Zobrazte histogramy simulovaných rm a z^m a superponujte je teoretickými hustotami příslušných normálních rozdělení. Vytvořte animaci zobrazující rozdělení výběrového korelačního koeficientu R a Fisherovy Z transformace pro různé rozsahy náhodného výběru n € {5,10,..., 70}. Pearsonuv korel. koeficient - R n = 5, p = 0.8 oj o _ CO - oj I-1-1-1-1-1 0.5 0.6 0.7 0.8 0.9 1.0 P Fisherova Z-promenna - Zr n =5, p = 0.8 ^ - co - TO o I-1-1-1-1-1 -0.5 0.0 0.5 1.0 1.5 2.0 Z, 2. Vytvořte animaci zobrazující rozdělení výběrového korelačního koeficientu R € {0.1, 0.2,..., 0.9} a Fisherovy Z transformace pro tyto různé korelační koeficienty. Animace vytvořte pro (a) n = 5, (b) n = 10, (c) n = 100. 3 Pearsonuv korel. koeficient - n = 10, p = 0.1 Fisherova Z-promenna n = 10, p = 0.1 0.0 0.2 T" T" 0.4 0.6 P I 0.8 I 1.0 A 4 Pearsonuv korel. koeficient - R n = 50, p = 0.1 I-1-1-1-1-1 0.0 0.2 0.4 0.6 0.8 1.0 Fisherova Z-promenna n = 50, p = 0.1 o LO OJ o OJ O LO o LO Ö O Ö -2 -1 0 Příklad 14. Test o korelačním koeficientu p: Mějme data one-sample-correlation-skull-mf.txt a proměnné největší výška mozkovny skuli.pH a morfologická výška tváře face.H (obě v mm) starověké egyptské mužské populace, o kterých předpokládáme, že mají dvourozměrné normální rozdělení A^//, S). 1. Otestujte hypotézu o tom, že korelační koeficient největší výšky mozkovny a morfologické výšky tváře je rovný 0.251. 2. Vypočítejte 100 x (1 — a)% empirický DIS pro korelační koeficient, kde koeficient spolehlivosti 1 — a = 0.95. Použijte (a) Waldovu testovací statistiku Zyy', (b) testovací statistiku poměrem věrohodnosti Ulr- 1 0.1 1 1 1 1 1 0.2 0.3 0.4 0.5 0.6 p test.statistika W kritický obor p-hodnota Waldův přístup 1.104799 (-oo, -1.959964) U (1.959964; oo) (0.1868617,0.4605561) 0.2692467 Věrohodnostní přístup 1.241757 (3.841459; oo) (0.1880626,0.4590998) 0.2651328 5 Příklad 15. Rozdělení testovacích statistik F, Uwi U s a Ulr jednovýběrového testu o rozptylu a2 Pomocí simulační studie ověřte, že • statistika F ■■ nS2n Au n 1 n = 2 l v -^obs n f ■^obs = 2 l n • statistika Uw = — I--1 ~ x (1) 2 2/ 2 1 ~x2(i) • statistika [7ljí = F0bs — n yl + ln ^-J J ~ x (1) • Vygenerujte M = 1000 pseudonáhodných výběrů o rozsahu n = 5. Pro každý náhodný výběr vypočítejte hodnoty realizací testovacích statistik F, Uw, U$ a Ulr- Vytvořte histogramy těchto testovacích statistik a superponujte je křivkami příslušného rozdělení. • Vytvořte animaci, pomocí které bude zřejmé, jak se s rostoucím n rozdělení testovacích statistik F, Uw, U$ a Ulr asymptoticky blíží k příslušnému rozdělení. Animaci spravte pro měnící se n € {3, 4, 5,10,15, 20, 25, 30, 35, 40,45, 50,60, 70, 80, 90,100, 200, 300,400, 500, 600,700, 800, 900,1000} Rozděleni testovaci statistiky Us Rozděleni testovací statistiky Ulr n = 3 n = 3 i-1-1-1-1 i-1-1-1-1 0 10 20 30 40 0 5 10 15 20 6 Příklad 16. Pokračování příkladu 15 • Vygenerujte M = 1000 pseudonáhodných výběrů o rozsahu n = 5. Pro každý náhodný výběr stanovte hodnoty realizací testovacích statistik F, Uw, Us a Ulr- Pomocí funkce density() vypočítejte jádrové odhady rozdělení testovacích statistik Uw, Us a Ulr- Tyto jádrové odhady zobrazte do jednoho grafu a barevně je odlište. Do grafu dokreslete křivku hustoty \2 rozdělení o jednom stupni volnosti a vertikální referenční čáru v hodnotě 0. • Vytvořte animaci, pomocí které bude zřejmé, jak se s rostoucím n rozdělení testovacích statistik Uw, U s a Ulr asymptoticky blíží k X2(l) rozdělení. Animaci spravte pro měnící se n € {3, 4, 5,10,15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80,90,100, 200, 300,400, 500, 600, 700, 800, 900,1000} 7 Příklad 17. Pravděpodobnost pokrytí — l.část 1. Nechť X ~ Bin(N,p), kde TV = 30 a p = 0.8 a pravděpodobnost úspěchu p = |^ = 0.8, kde x = 24 a -/V = 30. Waldův 95% empirický DIS pro p je rovný (d,h) = (0.657,0.943). Vypočítejte pravděpodobnost pokrytí tohoto intervalu. Poznámka: Pravděpodobnost pokrytí Waldova 95 % DIS pro p vypočítáme následovně: Pr(pokryti) = ^^Pr(X = Npj : p € Waldovu 95% DIS pro pj), j kde pj € JVlj = {^j, ^j,..., 1 — ^j}, t.j. jde o součet takových funkčních hodnot pravděpodobnostní funkce v bodech Npj, kde p € Waldovu 95% DIS pro pj. Výsledky uspořádejte do tabulky, jejíž sloupce budou Xj, Pj, dj (dolní hranice Waldova 95% DIS pro pj), hj (horní hranice Waldova 95% DIS pro pj), Pr(pokrytí) a pokrytí (indikace toho, zda p náleží nebo nenáleží do Waldova 95 % DIS pro pj). 2. Celý postup opakujte tentokrát pro parametr p = 0.79. Pozorujte, jak se změnila pravděpodobnost pokrytí. 1 xj PJ dj hj P (pokryti) pokryti 2 0 0 0 0 0 0 3 1 0 0333 -0.0309 0.0976 0 0 4 2 0 0667 -0.0226 0.1559 0 0 5 3 0.1 -0.0074 0.2074 0 0 6 4 0 1333 0.0117 0.255 0 0 7 5 0 1667 0.0333 0.3 0 0 8 6 0.2 0.0569 0.3431 0 0 9 7 0 2333 0.082 0.3847 0 0 10 8 0 2667 0.1084 0.4249 0 0 11 9 0.3 0.136 0.464 0 0 12 10 0 3333 0.1646 0.502 0 0 13 11 0 3667 0.1942 0.5391 0 0 14 12 0.4 0.2247 0.5753 0 0 15 13 0 4333 0.256 0.6107 0 0 16 14 0 4667 0.2881 0.6452 0 0 17 15 0.5 0.3211 0.6789 2e-04 0 18 16 0 5333 0.3548 0.7119 7e-04 0 19 17 0 5667 0.3893 0.744 0.0022 0 20 18 0.6 0.4247 0.7753 0.0064 0 21 19 0 6333 0.4609 0.8058 0.0161 1 22 20 0 6667 0.498 0.8354 0.0355 1 23 21 0.7 0.536 0.864 0.0676 1 24 22 0 7333 0.5751 0.8916 0.1106 1 25 23 0 7667 0.6153 0.918 0.1538 1 26 24 0.8 0.6569 0.9431 0.1795 1 27 25 0 8333 0.7 0.9667 0.1723 1 28 26 0 8667 0.745 0.9883 0.1325 1 29 27 0.9 0.7926 1.0074 0.0785 1 30 28 0 9333 0.8441 1.0226 0.0337 0 31 29 0 9667 0.9024 1.0309 0.0093 0 32 30 1 1 1 0.0012 0 Tabulka 1: Contingency table of absolute frequencies - Womac 8 p=0.8 p=0.79 pst.pokryti 0.9463 0.8876 Tabulka 2: Contingency table of absolute frequencies - Womac Príklad 18. Pravděpodobnost pokrytí — 2. část Nechť Xi ~ Bin(N, pi). Vypočítejte pravděpodobnosti pokrytí 1. Waldova 95% DIS, 2. skóre 95 % DIS, 3. věrohodnostního 95 % DIS pro každé pi: kde pi náležící množině JVlj = (i, 1 — i) jsou ekvidistantně vzdálené hodnoty ležící mezi ^ a 1- -| a jejich počet je M = 1 000. Nakreslete obrázek, kde na ose x budou pi a na ose y bude pravděpodobnost pokrytí Pr2(pokrytí). Zvolte (a) N = 30, (b) TV = 100 a (c) N = 1000. Poznámka: Pravděpodobnosti pokrytí 95 % DIS pro pi vypočítáme následovně Pr2(pokrytí) = ^Pr(X = Npj : pt e 95% DIS pro Pj), j kde pj € JVlj = jj,..., 1 — i}, t.j. jde o součet takových funkčních hodnot pravděpodobnostní funkce v bodech Npj, kde pi €95% DIS pro pj. Pro ty DIS, které mají pro p = 0 a p = 1 nenulovou šířku, můžeme použít Pst pokryti 95% skoré IS pro p N = 30 Pst pokryti 95% skoré IS pro p N - 100 Pst pokryti 95% skoré IS pro p N - 500 mil' f< ^unp«Lnnrv 9 Pst pokryti 95% veroh. IS pro p N = 30 Pst pokryti 95% veroh. IS pro p N = 100 0.0 0.2 0.4 0.6 0.8 1.0 Pst pokryti 95% veroh. IS pro p N = 500 10