9. Testování hypotéz o průměru pro jeden výběr a porovnávání dvou skupin


Jednovýběrový z-test
-Test hypotézy, že průměr populace, z níž pochází náš výběr je roven určitému číslu – očekávané
hodnotě
-Testová statistika:
•Z=(pozorovaná hodnota – očekávaná hodnota)/
•standardní chyba pozorované hodnoty
-Pozorovaná hodnota = průměr naměřených hodnot  x̄
-Směrodatná odchylka pozorované hodnoty σx
-Z ~ N(0,1) pro dostatečně velké n
-
-

Jednovýběrový t-test
-σx obvykle neznáme => nahrazujeme odhadem sx vypočteným z našeho výběru
•
•
-T má Studentovo t rozdělení o n-1 stupních volnosti
-=> jednovýběrový t-test
•
-
-

Normální x Studentovo t rozdělení
•Pro malý rozsah výběru se můžou změnit dvě věci:
-Výběrová odchylka (s) nemusí být spolehlivým odhadem populační směrodatné odchylky (σ)
-Pokud není rozdělení populace normální, nemusí být normální ani rozdělení výběrových průměrů –
velmi malý výběr (<15), extrémní odchylka od normálního rozdělení
•Centrální limitní věta: i když náhodná veličina není rozdělena normálně, rozdělení výběrových
průměrů se blíží normálnímu rozdělení
-
-

Normální x Studentovo t rozdělení
-=> nutno použít Studentovo t rozdělení
-V podstatě celá řada t rozdělení pro různé stupně volnosti (df)
-t rozdělení o jednom, dvou, třech, … stupních volnosti
-Jednovýběrové testy – df = n-1

Oboustranná a jednostranná alternativa
-Oboustranná alternativa:
-μ0 je konstanta  (nejčastěji μ0 = 0)
-Zamítáme H0 pro nebo
-Jednostranná alternativa:
-Zamítáme H0 pro
-Jednostranná alternativa:
-Zamítáme H0 pro
-Symetrické rozdělení =>

Porovnání průměrů pro dva nezávislé výběry
-Srovnání dvou souborů
-Rozdíl mezi populačním průměrem v léčené a kontrolní skupině
Þrozdíl mezi dvěma výběrovými průměry
-Výběrové průměry se mezi výběry liší => liší se i rozdíly mezi výběrovými průměry
-Rozdělení rozdílů výběrových průměrů má nulovou střední hodnotu se standardní chybou, která je
určena směrodatnou odchylkou celé populace (směrodatné odchylky výběrů) a n

Dvouvýběrový t-test
-Předpokládáme platnost H0 a spočteme pst, s jakou dostaneme náš výsledek nebo ještě extrémnější
hodnotu
-Pro výpočet této psti potřebujeme vědět něco o rozdělení rozdílu průměrů obou výběrů
-Předpokládáme normální rozdělení výběrových průměrů (základní rozdělení skupiny podobné
normálnímu)
-
-

Dvouvýběrový t-test
ÞT = (rozdíl výběrových průměrů – očekávaný rozdíl za platnosti H0) / odhad standardní chyby
rozdílu výběrových průměrů
-T má Studentovo t rozdělení o n1 + n2 – 2 stupních volnosti
-Standardní chyba rozdílu výběrových  průměrů je směrodatná odchylka rozdělení rozdílu výběrových
průměrů, který označíme
Þ                                   n1, n2 – rozsahy výběrů,
• s- sm. odchylka obou skupin
-

Dvouvýběrový t-test
-s – sdružený odhad směrodatné odchylky
-Sdružený odhad rozptylu:
-
-
- ,      - výběrové rozptyly pro jednotlivé skupiny
-Sdružený odhad směrodatné odchylky
-Odhad standardní chyby rozdílu výběrových průměrů
-

Dvouvýběrový t-test
=>
-0 je pokud H0: neexistuje žádný rozdíl
-Lze testovat i konkrétní libovolný rozdíl

Předpoklady!!!
-Nezávislost výběrů
-Normální rozdělení
-Prosté náhodné výběry (kvůli nezávislosti pozorování)
-Shodné rozptyly ve skupinách

Interval spolehlivosti pro rozdíl mezi dvěma průměry
-Odhad rozdílu mezi dvěma průměry
-Krajní body intervalu spolehlivosti:
-
-t – příslušný kvantil Studentova t rozdělení
-Např.

Porovnání populačních pravděpodobností
-Porovnání pravděpodobností výskytu daného jevu ve dvou různých populacích (dva nezávislé výběry)
-Pro dostatečně velké rozsahy n1 a n2
-
-
-
-
-
-
-p1, p2 – populační pravděpodobnosti výskytu jevu
-

Porovnání populačních pravděpodobností
-r1, r2 – počty případů ve výběrech
-Společný odhad relativní četnosti:
-
-
-
-
-
-Podmínka: pro oba výběry
-

Párový t-test
-Párování dle podobnosti, která může ovlivnit výsledek, časová měření, …
-Testujeme významnost průměrného rozdílu
-Rozdíly jsou normálně rozdělené s průměrem μ a rozptylem σ2
-Průměr z n rozdílů  d ̅ bude mít průměrnou hodnotu μ a rozptyl σ2/n

Párový t-test
T = (pozorovaná hodnota – předpokládaná hodnota)/odhad směrodatné chyby
, s – směrodatná odchylka rozdílů
má t rozdělení o n-1 stupních volnosti

Za platnosti nulové hypotézy (průměrný rozdíl μ = 0) bude hodnota testovacího kritéria s 95% pstí
mezi
-2,228 a 2,228

Testování hypotéz
-Stanovíme nulovou a alternativní hypotézu
-Určíme rozdělení pravděpodobnosti testové statistiky při nulové hypotéze
-Zvolíme hladinu významnosti testu α (doplněk koeficientu spolehlivosti P)
-Na základě zvolené hladiny významnosti vypočteme tzv. kritické hodnoty (příslušného rozdělení
psti), které ohraničují kritický obor
-Vypočítáme hodnotu testové statistiky, pokud padne do kritického oboru, zamítáme H0 na hladině
významnosti α
-V opačném případě na základě zkoumaných dat nemůžeme zamítnout H0 na hladině významnosti α (H0
nemusí být pravdivá)
-