9. Testování hypotéz o průměru pro jeden výběr a porovnávání dvou skupin Jednovýběrový z-test -Test hypotézy, že průměr populace, z níž pochází náš výběr je roven určitému číslu – očekávané hodnotě -Testová statistika: •Z=(pozorovaná hodnota – očekávaná hodnota)/ •standardní chyba pozorované hodnoty -Pozorovaná hodnota = průměr naměřených hodnot x̄ -Směrodatná odchylka pozorované hodnoty σx -Z ~ N(0,1) pro dostatečně velké n - - Jednovýběrový t-test -σx obvykle neznáme => nahrazujeme odhadem sx vypočteným z našeho výběru • • -T má Studentovo t rozdělení o n-1 stupních volnosti -=> jednovýběrový t-test • - - Normální x Studentovo t rozdělení •Pro malý rozsah výběru se můžou změnit dvě věci: -Výběrová odchylka (s) nemusí být spolehlivým odhadem populační směrodatné odchylky (σ) -Pokud není rozdělení populace normální, nemusí být normální ani rozdělení výběrových průměrů – velmi malý výběr (<15), extrémní odchylka od normálního rozdělení •Centrální limitní věta: i když náhodná veličina není rozdělena normálně, rozdělení výběrových průměrů se blíží normálnímu rozdělení - - Normální x Studentovo t rozdělení -=> nutno použít Studentovo t rozdělení -V podstatě celá řada t rozdělení pro různé stupně volnosti (df) -t rozdělení o jednom, dvou, třech, … stupních volnosti -Jednovýběrové testy – df = n-1 Oboustranná a jednostranná alternativa -Oboustranná alternativa: -μ0 je konstanta (nejčastěji μ0 = 0) -Zamítáme H0 pro nebo -Jednostranná alternativa: -Zamítáme H0 pro -Jednostranná alternativa: -Zamítáme H0 pro -Symetrické rozdělení => Porovnání průměrů pro dva nezávislé výběry -Srovnání dvou souborů -Rozdíl mezi populačním průměrem v léčené a kontrolní skupině Þrozdíl mezi dvěma výběrovými průměry -Výběrové průměry se mezi výběry liší => liší se i rozdíly mezi výběrovými průměry -Rozdělení rozdílů výběrových průměrů má nulovou střední hodnotu se standardní chybou, která je určena směrodatnou odchylkou celé populace (směrodatné odchylky výběrů) a n Dvouvýběrový t-test -Předpokládáme platnost H0 a spočteme pst, s jakou dostaneme náš výsledek nebo ještě extrémnější hodnotu -Pro výpočet této psti potřebujeme vědět něco o rozdělení rozdílu průměrů obou výběrů -Předpokládáme normální rozdělení výběrových průměrů (základní rozdělení skupiny podobné normálnímu) - - Dvouvýběrový t-test ÞT = (rozdíl výběrových průměrů – očekávaný rozdíl za platnosti H0) / odhad standardní chyby rozdílu výběrových průměrů -T má Studentovo t rozdělení o n1 + n2 – 2 stupních volnosti -Standardní chyba rozdílu výběrových průměrů je směrodatná odchylka rozdělení rozdílu výběrových průměrů, který označíme Þ n1, n2 – rozsahy výběrů, • s- sm. odchylka obou skupin - Dvouvýběrový t-test -s – sdružený odhad směrodatné odchylky -Sdružený odhad rozptylu: - - - , - výběrové rozptyly pro jednotlivé skupiny -Sdružený odhad směrodatné odchylky -Odhad standardní chyby rozdílu výběrových průměrů - Dvouvýběrový t-test => -0 je pokud H0: neexistuje žádný rozdíl -Lze testovat i konkrétní libovolný rozdíl Předpoklady!!! -Nezávislost výběrů -Normální rozdělení -Prosté náhodné výběry (kvůli nezávislosti pozorování) -Shodné rozptyly ve skupinách Interval spolehlivosti pro rozdíl mezi dvěma průměry -Odhad rozdílu mezi dvěma průměry -Krajní body intervalu spolehlivosti: - -t – příslušný kvantil Studentova t rozdělení -Např. Porovnání populačních pravděpodobností -Porovnání pravděpodobností výskytu daného jevu ve dvou různých populacích (dva nezávislé výběry) -Pro dostatečně velké rozsahy n1 a n2 - - - - - - -p1, p2 – populační pravděpodobnosti výskytu jevu - Porovnání populačních pravděpodobností -r1, r2 – počty případů ve výběrech -Společný odhad relativní četnosti: - - - - - -Podmínka: pro oba výběry - Párový t-test -Párování dle podobnosti, která může ovlivnit výsledek, časová měření, … -Testujeme významnost průměrného rozdílu -Rozdíly jsou normálně rozdělené s průměrem μ a rozptylem σ2 -Průměr z n rozdílů d ̅ bude mít průměrnou hodnotu μ a rozptyl σ2/n Párový t-test T = (pozorovaná hodnota – předpokládaná hodnota)/odhad směrodatné chyby , s – směrodatná odchylka rozdílů má t rozdělení o n-1 stupních volnosti Za platnosti nulové hypotézy (průměrný rozdíl μ = 0) bude hodnota testovacího kritéria s 95% pstí mezi -2,228 a 2,228 Testování hypotéz -Stanovíme nulovou a alternativní hypotézu -Určíme rozdělení pravděpodobnosti testové statistiky při nulové hypotéze -Zvolíme hladinu významnosti testu α (doplněk koeficientu spolehlivosti P) -Na základě zvolené hladiny významnosti vypočteme tzv. kritické hodnoty (příslušného rozdělení psti), které ohraničují kritický obor -Vypočítáme hodnotu testové statistiky, pokud padne do kritického oboru, zamítáme H0 na hladině významnosti α -V opačném případě na základě zkoumaných dat nemůžeme zamítnout H0 na hladině významnosti α (H0 nemusí být pravdivá) -