Testování hypotéz 1. z se má k s[`X] [ ]jako se má t k …. a) s b) s^2 c) s d) s[`X ] 2. Které z následujících lze považovat za korektní statistické hypotézy? a) m = 63,0 c) s = 10 e) s = 10,00 b) m = 1,2 d) r = 0,50 f) r = 0 3. Statistické hypotézy jsou formulovány ve statistikách nebo v parametrech? 4. Kdy jsou si s[`X] a s rovny? 5. Jak velké musí být n, aby směrodatná odchylka výběrového rozložení průměru s[`X] byla pouze 10% směrodatné odchylky s [ ]rozložení proměnné X? 6. Pokud z = 2,0, můžeme H[0] zamítnout [platí stejná odpověď i pro t = 2,0 ?] a) na 1% hladině statistické významnosti b) na 5% hladině statistické významnosti, ale ne na 1% hladině statistické významnosti c) ani na 5% ani na 1% hladině statistické významnosti 7. Který z následujících výsledků je nejméně pravděpodobný, tj. důsledkem výběrové chyby? a) z = -3,1 b) z = 0,00 c) z = 2,0 d) z = 2,58 8. Je-li H[0] pravdivá, je pravděpodobnost získání z většího než 1,31 stejná jako pravděpodobnost získání z menšího než -1,31? 9. Jaký symbol používáme pro velikost chyby I. typu, kterou jsme ochotni tolerovat? 10. Je-li H[0] pravdivá, pravděpodobnost získání výběrového průměru, který by byl od m tak vzdálen, jako je vzdálen získaný výběrový průměr m, označujeme písmenem …. 11. Je-li p < a, zamítneme H[0]? 12. Je-li p > a, zůstává H[0] udržitelná? 13. Pokud konkrétní 95% interval spolehlivosti pro m sahá od 47,2 do 63,4, které z následujících statistických hypotéz by byly zamítnuty na 5% hladině statistické významnosti? a) m = 45 b) m = 50 c) m = 55 d) m = 60 e) m = 65 14. Předpokládejme, že H[0]: m = 100 byla zamítnuta na 1% hladině a) je hodnota 100 uvnitř 99% intervalu spolehlivosti? b) je hodnota 100 uvnitř 95% intervalu spolehlivosti? 15. Která z následujících úrovní statistické významnosti, vyžaduje k zamítnutí H[0] největší rozdíl mezi m a hypotetickou hodnotou m? a) 0,01 b) 0,05 c) 0,10 16. Statistika t se používá k testování H[0]: m = c, když neznáme …. a) n b) m c) s d) a 17. Když n = 20, jsou kritické hodnoty pro t mírně vyšší než pro z? 18. Ve kterém z následujících případů se kritické hodnoty pro t a pro z liší nejvíce? a) n = 5 b) n = 10 c) n = 100 d) n = 1000 19. Při testování H[0]: m = c, kde c je nějaká konstanta, která z následujících statistik se používá častěji, z nebo t ? Proč? 21. Jaké jsou pro následující velikosti vzorků s nimi spojené stupně volnosti pro testování hypotézy H[0]: m = c? a) 11 b) 60 c) 101 22. Pokud je H[0] pravdivá, ale byla na základě našich dat zamítnuta, k chybě jakého typu došlo? a) chyba I. typu b) chyba II. typu c) nedošlo k žádné chybě 23. Pokud je H[0] pravdivá a na základě našich dat nebyla zamítnuta, došlo k chybě II. typu? 24. Pokud je H[0] pravdivá, jaká je pravděpodobnost jejího zamítnutí na 5% hladině statistické významnosti, tj. pravděpodobnost chyby I. typu? 25. Pokud a = 0,05 a H[0] není zamítnuta, známe pravděpodobnost chyby II. typu? 26. Pokud a = 0,05 a p < 0,01, lze H[0] zamítnout na jednoprocentní hladině statistické významnosti? 29. Pokud a = 0,05 a n = 20, jaké jsou kritické hodnoty t pro a) oboustranný test b) jednostranný test 32. Pokud je H[0] nepravdivá a nám se ji nepodaří na základně svých dat zamítnout, došlo k a) chybě I. typu b) chybě II. typu c) chybě I. i II. typu d) žádné chybě 33. ___ se má k a jako se má chyba II. typu k ___. P1. Definujte následující termíny a) nulová hypotéza, H[0 ] b) alternativní hypotéza, H[1 ] c) chyba I. typu d) chyba II. typu e) hladina statistické významnosti, a f) síla testu, 1 – b P2. Průměrná výška (m) dospělých mužů v USA je 176,53 cm se směrodatnou odchylkou (s) 7,62 cm. Předpokládejme, že průměrná výška ve vzorku 25 mentálně retardovaných mužů nám vyšla 171,45 cm. Otázkou je, zda se tento průměr statisticky významně liší od m = 176,53 cm. (předpokládejme, že směrodatná odchylka v populaci mentálně retardovaných mužů je také s = 7,62 cm). a) Formulujte H[0 ] b) Vzhledem k uvedeným informacím, použili byste z nebo t jako testovou statistiku? c) Je v pořádku formulovat H[1]: m < 176,53 cm potom, co jsme zjistili, že m = 171,45 cm? d) Jaká je hodnota s[`X] [ ]? e) Jaká je hodnota z ? f) Zamítneme H[0] při a = 0,01? g) Zůstaly by kritické hodnoty z stejné, kdyby se n zvedlo na 100? h) Zůstala by hodnota s[`X] [ ] stejná, kdyby se n zvedlo na 100? P10. Standardizovaný test čtení byl administrován vzorku 16 šesťáků zařazených do programu zlepšování dovednosti čtení. Jejich průměrné skóre bylo ke konci roku 8,0 se směrodatnou odchylkou 1,8. Badatel by chtěl vědět, zda se tento výběrový průměr liší od hodnoty 6,8, což je celonárodní průměr šesťáků ke konci roku. a) Formulujte H[0 ] b) Je třeba použít z nebo t jako testovou statistiku? c) Jaká je hodnota výběrové chyby průměru? d) Spočítejte t. e) Jaké jsou kritické hodnoty t při a = 0,05 a při a = 0,01? f) Lze H[0] zamítnout na 1% nebo 5% hladině? g) Vytvořte 95% a 99% interval spolehlivosti pro m. Odpovědi 1. d 2. b, c, d 3. v parametrech 4. Když n =1. 5. n = 100 6. b [obecně ne, záleží na stupních volnosti spojených s t-rozložením] 7. a 8. ano 9. a 10. p 11. ano 12. ano 13. ae 14. a) ne, b) ne 15. a 16. c 17. ano 18. a 19. t, protože s známe jen zřídka 21. a) 10, b) 59, c) 100 22. a 23. ne. Když je H[0] pravdivá její nezamítnutí je správným rozhodnutím. 24. 0,05 25. ne, potřebujeme znát další údaje 26. ano, a představuje maximální riziko chyby, které jsme ochotni podstoupit 29. a) 2,09 b) 1,72 32. b 33. chyba I. typu; b P2. a) H[0]: m = 176,53 b) z c) ne d) 7,62/odm(25) = 1,5 e) (176,53 – 171,45)/1,5 = 3,39 f) ano, p (z ≥ |3,39| | m = 176,53)=1-NORMSDIST(3,39)=0,00035 g) ano, normální rozložení je jen jedno a na stupních volnosti nezáleží. h) ne byla by 2x menší, tj. 0,76. P10. a) H[0]: m = 6,8 b) t c) 1,8/odm(16) = 0,45 e) (6,8 – 8,0)/0,45 = 2,67 f) p (t ≥ |a|)=0,05); a =TINV(0,05;15)=2,13; pro a = 0,01 je kritické t = 2,95. g) Na 1% ne, na 5% ano. h) 95% CI = (m ± 2,13s[`X ] [ ]) = (7,04; 8,96); 99% CI = (m ± 2,95s[`X ] [ ]) = (6,67; 9,33)