logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Opakování – základy testování hypotéz Shrnutí statistických testů Jednovýběrové parametrické testy Dvouvýběrové parametrické testy Biostatistika logo-IBA •Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek • Opakování 1.Co je nulová a alternativní hypotéza? 2.Co je testová statistika? 3.Jakými způsoby můžeme testovat hypotézy? 4.Co je chyba I. a II. druhu? 5.Co vyjadřuje p-hodnota? 6.Jaký je rozdíl mezi parametrickými a neparametrickými testy? 7.Jaký je rozdíl mezi jednovýběrovými a dvouvýběrovými testy? 8.Jaký je rozdíl mezi jednostrannými a oboustrannými testy? 9.Jaký je rozdíl mezi párovými a nepárovými testy? 10. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Shrnutí statistických testů logo-IBA Shrnutí statistických testů Typ srovnání Nulová hypotéza Parametrický test Neparametrický test 1 výběr dat vs. referenční hodnota Střední hodnota je rovna zvolené referenční hodnotě. jednovýběrový t-test / z-test Jednovýběrový Wilcoxonův test 2 nezávislé skupiny dat (test shody středních hodnot) Střední hodnoty se mezi skupinami neliší. nepárový t-test Mannův-Whitneyho test 2 nezávislé skupin dat (test shody rozptylů = homoskedasticity) Rozptyl obou skupin je shodný. F-test Levenův test 2 párově závislé výběry dat Rozdíl (diference) párových hodnot je nulový. párový t-test Wilcoxonův test; znaménkový test Shoda rozdělení výběru s teoretickým rozdělením Rozdělení dat odpovídá teoretickému (vybranému) rozdělení. test dobré shody (χ2 test) Shapirův-Wilkův test; Kolmogorovův-Smirnovův test; Lilieforsův test 3 a více skupin nepárově (test shody středních hodnot) Střední hodnoty se mezi skupinami neliší. ANOVA Kruskalův-Wallisův test Korelace Neexistuje vztah mezi hodnotami dvou výběrů. Pearsonův korelační koeficient Spearmanův korelační koeficient Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek logo-IBA Základní rozhodování o výběru statistických testů Typ dat Spojitá x spojitá data Spojitá x kategoriální data Kategoriální x kategoriální data Jeden výběr Dva výběry Tři a více výběrů (nepárově) Jeden výběr Více výběrů Párová data Nepárová data Pearsonův korelační koeficient Jednovýběrový t-test Párový t-test Dvouvýběrový t-test ANOVA Párová data Nepárová data Chí-kvadrát test Spearmanův korelační koeficient JednovýběrovýWilcoxonův test Wilcoxonův / znaménkový test Mannův-Whitneyho test Kruskalův-Wallisův test Jednovýběrový binomický test McNemarův test Fisherův exaktní test Parametrické testy Neparametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita E. Janoušová, L. Dušek logo-IBA Schéma při testování pomocí jednovýběrových testů Data Normální rozdělení? Vizuální ověření normality Histogram, Q-Q graf, P-P graf, N-P graf, krabicový graf Testové ověření normality S-W test, K-S test, Lilieforsův test NE ANO Logaritmická transformace Normální rozdělení? NE ANO Jednovýběrový Wilcoxonův test na původních datech Jednovýběrový t-test / z-test na transformovaných datech Jednovýběrový t-test / z-test Opakování Parametrické testy Neparametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita E. Janoušová, L. Dušek logo-IBA Schéma při testování pomocí párových testů Data Normální rozdělení? (normální rozdělení diferencí!) NE ANO Párový t-test Párový Wilcoxonův test / znaménkový test Parametrické testy Neparametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita E. Janoušová, L. Dušek logo-IBA Schéma při testování 2 a více skupin Data Normální rozdělení v rámci skupin? NE ANO Logaritmická transformace Normální rozdělení v rámci skupin? NE ANO Dvouvýběrový t-test, ANOVA na transformovaných datech Dvouvýběrový t-test, ANOVA Homogenita rozptylů? NE ANO Mannův-Whitneyho test, Kruskalův-Wallisův test * Homogenita rozptylů? NE ANO Mannův-Whitneyho test, Kruskalův-Wallisův test na původních datech * Mannův-Whitneyho test, Kruskalův-Wallisův test na původních datech Parametrické testy Neparametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita E. Janoušová, L. Dušek * Při nesplnění předpokladu shody rozptylů mezi skupinami lze použít i parametrický t-test s Welchovou korekcí logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Parametrické testy logo-IBA Parametrické testy Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek —Předpoklad: normalita dat —Jednovýběrový z-test (porovnání základního a výběrového souboru, známe střední hodnotu a rozptyl základního souboru) —Studentův t-test (testování rozdílů dvou středních hodnot) 1.Jednovýběrový t-test (porovnání základního a výběrového souboru, známe střední hodnotu ale neznáme rozptyl základního souboru; nahrazujeme jej výběrovým rozptylem našich dat) 2.Dvouvýběrový t-test (porovnání dvou výběrových souborů, neznáme střední hodnotu základního souboru): - párový (závislé výběry) - nepárový (nezávislé výběry) —F-test (testování rozdílů dvou rozptylů) logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Jednovýběrový t-test 1. Statistické testy o parametrech jednoho výběru logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace —Jednovýběrové statistické testy srovnávají některou popisnou statistiku vzorku (průměr, směrodatnou odchylku) s jediným číslem, jehož význam je ze statistického hlediska hodnota cílové populace — —Z hlediska statistické teorie jde o ověření, zda daný vzorek pochází z testované cílové populace. logo-IBA —Určitá linka autobusové městské dopravy má v době dopravní špičky průměrnou rychlost 8 km/hod. Uvažovalo se o tom, zda změna trasy by vedla ke změně průměrné rychlosti. Nová trasa byla proto projeta v deseti náhodně vybraných dnech a byly zjištěny tyto průměrné rychlosti: 8,4; 7,9; 9,0; 7,8; 8,0; 7,8; 8,5; 8,2; 8,2; 9,3. Rozhodněte, zda změna trasy vede ke změně průměrné rychlosti. Předpokládáme normální rozdělení a α=0,05. —Postup: 1.Na hladině významnosti 0,05 testujeme hypotézu H0: , proti HA : 2.Vypočteme aritmetický průměr a rozptyl výběrového souboru. 3.Vypočteme testovou statistiku t: 4. 4. 4.Vypočtené t porovnáme s kritickou hodnotou t1-α/2(n-1): 5. 5.Je-li |t| ≤ t1-α/2(n-1) statisticky nevýznamný rozdíl testovaných parametrů při zvolené α; nulovou hypotézu nezamítáme, na hladině významnosti α=0,05 se nepodařilo prokázat, že by změna trasy měla za následek změnu průměrné rychlosti. — 1. Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 1: Jednovýběrový t-test http://www.spartapraha2000.cz/img/picture/1325/autobus.gif logo-IBA Příklad 1: Řešení v softwaru Statistica I Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek • V menu Statistics zvolíme Basic statistics ,vybereme t-test, single sample 2 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 3 • Vybereme proměnnou, kterou chceme testovat • Na kartě Advanced napíšeme do okénka Test all means against velikost střední hodnoty populace (lze také na kartě Quick, Options) • p-value for highlighting- Úroveň p-hodnoty lze změnit •Kliknutím na Summary t-test nebo na Summary získáme výstupy Řešení v softwaru Statistica II 1 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Řešení v softwaru Statistica III Výběrový průměr (průměr pozorovaných dat) Výběrová směrodatná odchylka (pozorovaných dat) Rozsah výběru Standardní chyba Referenční konstanta-předpokládaná velikost střední hodnoty Hodnota testovacího kritéria Stupeň volnosti POZOR: Platí pro oboustranný test!!! http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Dvouvýběrový párový a nepárový t-test 2. Statistické testy o parametrech dvou výběrů logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace —Jedním z nejčastějších úkolů statistické analýzy dat je srovnání spojitých dat ve dvou skupinách pacientů. Na výběr je celá škála testů, výběr konkrétního testu se pak odvíjí od toho, zda je o srovnání párové nebo nepárové a zda je vhodné použít test parametrický (má předpoklady o rozložení dat) nebo neparametrický (nemá předpoklady o rozložení dat, nicméně má nižší vypovídací sílu). — —Nejznámějšími testy z této skupiny jsou tzv. t-testy používané pro srovnání průměrů dvou skupin hodnot logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Dvouvýběrové testy: párové a nepárové I —Při použití dvouvýběrových testů srovnáváme spolu dvě rozložení. Jejich základním dělením je podle designu experimentu na testy párové a nepárové. > —Základním testem pro srovnání dvou nezávislých rozložení spojitých čísel je nepárový dvouvýběrový t-test —Základním testem pro srovnání dvou závislých rozložení spojitých čísel je párový dvouvýběrový t-test logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Předpoklady nepárového dvouvýběrového t-testu —Náhodný výběr subjektů jednotlivých skupin z jejich cílových populací —Nezávislost obou srovnávaných vzorků —Přibližně normální rozložení proměnné v rámci skupin (drobné odchylky od normality ovšem nejsou kritické, test je robustní proti drobným odchylkám od tohoto předpokladu). Normalita může být testována testy normality. —Rozptyl v obou vzorcích by měl být přibližně shodný („homoskedasticita rozptylu“). Tento předpoklad je testován několika možnými testy – Levenův test nebo F-test. —Vždy je vhodné prohlédnout histogramy proměnné v jednotlivých vzorcích pro okometrické srovnání a ověření předpokladů normality a homogenity rozptylu – nenahradí statistické testy, ale poskytne prvotní představu. — 0 j(x) μ | logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Nepárový dvouvýběrový t-test – výpočet 1.Nulová hypotéza: průměry obou skupin jsou shodné • Alternativní hypotéza je, že nejsou shodné. 2.Prohlédnout průběh dat, průměr, medián apod. • Ověřit normalitu dat (např. Shapiro-Wilk test) • Ověřit homogenitu rozptylů (F-test) 2. 3.Vypočítat hodnotu testové statistiky a p-hodnotu. Když je vypočítaná p-hodnota menší než 0,05, zamítáme nulovou hypotézu. •V případě ověření homogenity je testována hypotéza shody rozptylů; v případě shodných rozptylů je vše v pořádku a je možné pokračovat ve výpočtu t-testu, v opačném případě není vhodné test počítat. logo-IBA http://us.cdn4.123rf.com/168nwm/shock77/shock771007/shock77100700030/7332866-legraa-na-kreslena-ovc e.jpg Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 2: Nepárový dvouvýběrový t-test —Průměrná hmotnost ovcí v čase páření byla srovnávána pro kontrolní skupinu a skupinu krmenou zvýšenou dávkou potravy. Kontrolní skupina obsahuje 30 ovcí, skupina se zvýšeným příjmem potravy pak 24 ovcí. •Vlastní experiment byl prováděn tak, že na začátku máme 54 ovcí (ideálně stejného plemene, stejně staré atd.), které náhodně rozdělíme do dvou skupin (náhodné rozdělování objektů do pokusných skupin je objektem celého specializovaného odvětví statistiky nazývaného randomizace). Poté co experiment proběhne, musíme nejprve ověřit teoretický předpoklad pro využití nepárového t-testu. Pro obě skupiny jsou vykresleny grafy (můžeme též spočítat základní popisnou statistiku), na kterých můžeme posoudit normalitu a homogenitu rozptylu, kromě okometrického pohledu můžeme pro ověření normality použít testy normality, pro ověření homogenity rozptylu pak F-test. •Pokud platí všechny předpoklady dvouvýběrového nepárového t-testu, můžeme spočítat testovou statistiku, výsledné t je 2,43 s 52 stupni volnosti, podle tabulek je a t0,975 (52)= 2,01, tedy |t|> t0,975 (52) a nulovou hypotézu můžeme zamítnout, skutečná pravděpodobnost je pak 0,018. Rozdíl mezi skupinami je 1,59 kg ve prospěch skupiny se zvýšeným příjmem. • • • • •Pro rozdíl mezi oběma soubory jsou spočítány 95% intervaly spolehlivosti jako 1,59±2.01*(0,655) kg, což odpovídá rozsahu 0,28 až 2,91 kg. To, že interval spolehlivosti nezahrnuje 0 je dalším potvrzením, že mezi skupinami je významný rozdíl – jde o další způsob testování významnosti rozdílů mezi skupinami dat – nulovou hypotézu o tom, že rozdíl průměrů dvou skupin dat je roven nějaké hodnotě zamítáme v případě, kdy 95% interval spolehlivosti rozdílu nezahrnuje tuto hodnotu (v tomto případě 0). > http://us.cdn3.123rf.com/168nwm/chudtsankov/chudtsankov1104/chudtsankov110400152/9398473-ba-la-ovce -kreslena-postava-ja-st-kva-t.jpg 1. skupina, N=30 2. skupina, N=24 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 2: Řešení v softwaru Statistica • Nejprve ověřte normalitu hmotnosti jednak ve skupině kontroly a ve skupině se zvýšenou potravou • • • • • • • • • • • • • V obou případech se tečky odchylují od přímky jenom málo a p-hodnoty S-W testu převyšují 0,05. Předpoklad o normálním rozložení dat v obou skupinách je oprávněný. • logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 2: Řešení v softwaru Statistica I • V menu Statistics zvolíme Basic statistics ,vybereme t-test, independent, by groups 2 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 2: Řešení v softwaru Statistica II • Zvolíme proměnné (Variables), • • Kliknutím na Summary získáme výstupy • • 2 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek •POZOR: Výstupní tabulku vyhodnocujeme zezadu!!! Příklad 2: Řešení v softwaru Statistica III Rozsah výběru 1. skupiny Hodnota testové statistiky (pro test shody středních hodnot) Výběrový průměr u 1. skupiny Výběrový průměr u 2. skupiny Počet stupňů volnosti Testová statistika pro test shody rozptylů (F-test) Rozsah výběru 2. skupiny Výběrová směrodatná odchylka u 2. skupiny Tyto sloupce lze interpretovat pouze pokud rozdíl mezi rozptyly byl neprůkazný !!! logo-IBA Příklad 2: Řešení v softwaru Statistica IV, F-test Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek • Pokud F-test prokázal odlišnost rozptylů, je nutné na záložce Options odškrtnout Test w/separate variance estimates (t-test se samost. odhady rozptylů) • 1 • Chceme-li homogenitu rozptylů testovat ještě jiným testem, než F-testem, vybereme test z nabídky Homogeneity of variances logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Párový dvouvýběrový t-test —Skupiny dat jsou spojeny přes objekt měření, příkladem může být měření parametrů pacienta před léčbou a po léčbě (nemusí jít přímo o stejný objekt, dalším příkladem mohou být např. krysy ze stejné linie). — —Oba soubory musí mít shodný počet hodnot, protože všechna měření v jednom souboru musí být spárována s měřením v druhém souboru. Při vlastním výpočtu se potom počítá se změnou hodnot (diferencí) subjektů v obou souborech. — —V případě, že se nejedná o měření na témže subjektu je vhodné si před párovým testem ověřit si, zda existuje vazba mezi oběma skupinami – vynesení do grafu, korelace. logo-IBA Příklad 3: Párový dvouvýběrový t-test Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Byl prováděn pokus s dietou u 18 diabetických krys, každá krysa byla vystavena dvěma dietám (jedné nové speciální a jedné kontrolní dietě). Protože každá krysa absolvovala obě diety, jde o párové uspořádání, kdy hodnoty v obou pokusech jsou spojeny přes pokusné zvíře. Zjistěte, zda testovaná dieta způsobí změnu hmotnosti u krys (zda se liší hmotnost krys po nové speciální a po kontrolní dietě). 1. 1.Nulová hypotéza zní, že skutečný průměrný rozdíl v hmotnosti krys po speciální a kontrolní dietě je nulový (speciální dieta nevedla ke změně hmotnosti ve srovnání s kontrolní dietou), alternativní hypotéza zní, že rozdíl hmotností je odlišný od nuly (speciální dieta vedla ke změně hmotnosti ve srovnání s kontrolní dietou). 2.Pro každou krysu je spočítán rozdíl hmotností naměřených po obou dietách a měly by být ověřeny předpoklady pro jednovýběrový t-test – alespoň přibližně normální rozložení diferencí. 3.Je spočítána testová statistika, výpočet vlastně probíhá jako jednovýběrový t-test, kde je zjišťována významnost průměru diferencí obou souborů jako rozdíl mezi touto hodnotou a nulou (0 je hodnota, kterou by průměrná diference měla nabývat, pokud platí nulová hypotéza). T=-1,72 s 17 stupni volnosti, skutečná p-hodnota=0,102 a tedy na hladině významnosti α=0,05 nemůžeme nulovou hypotézu zamítnout. 4. 4. 4. 4. 4. 4.Závěrem můžeme říci, že nulová hypotéza neexistence rozdílu vlivu na snížení váhy mezi oběma dietami nebyla zamítnuta, což znamená, že speciální dieta nemá významný vliv na snížení hmotnosti. 1. > http://www.zdarskypruvodce.cz/wp-content/krysa-zdar-nad-sazavou.png logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 3: Řešení v softwaru Statistica I • V menu Statistics zvolíme Basic statistics ,vybereme t-test, dependent samples 2 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 3: Řešení v softwaru Statistica II • Zvolíme proměnné (Variables), • • Kliknutím na Summary získáme výstupy • • 2 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 3: Řešení v softwaru Statistica III Výběrový průměr Výběrová směrodatná odchylka Počet pozorování Průměrná hodnota diferencí Výběrová směrodatná odchylka diferencí Hodnota testovacího kritéria logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Samostatné cvičení: Jednovýběrový t-test Dvouvýběrový nepárový t-test Dvouvýběrový párový t-test Samostatné cvičení logo-IBA 1. Příklad k procvičení —Načtěte data 04_1_priklad. U 21 lidí byla zjištěna výška postavy. Výsledky měření považujeme za realizace náhodného výběru z normálního rozložení. — 1.Na hladině významnosti testujte hypotézu, že střední hodnota výšky lidí je 175 cm proti oboustranné alternativě. Před provedením testu ověřte normalitu dat pomocí N-P plotu a S-W testu. 2.Na hladině významnosti testujte hypotézu, že střední hodnota výšky lidí je 181 cm proti oboustranné alternativě. 3. logo-IBA 2. Příklad k procvičení —Načtěte data 04_2_priklad, která obsahují následující sloupce: 1. sloupec - výška v 1. skupině, 2. sloupec - výška v 2. skupině, 3. sloupec - výška, 4. sloupec - skupina (1-muži, 2-ženy). — 1.Ověřte normalitu výšky v 1. skupině a ve 2. skupině pomocí N-P plotu a histogramu, teprve potom pomocí testů. 2.Na hladině významnosti 0,05 testujte hypotézu, že rozptyly výšek skupiny 1 a 2 jsou shodné. 3.Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty výšek skupiny 1 a 2 jsou shodné. 4.Výstupy doplňte krabicovými grafy (box-ploty). 5. logo-IBA 3. Příklad k procvičení —5 žen vyzkoušelo novou dietu. Načtěte data 04_3_priklad, který obsahuje následující údaje: 1. sloupec - hmotnost před dietou, 2. sloupec - hmotnost po dietě. — 1.Na hladině významnosti 0,05 testujte hypotézu, že dieta neměla významný vliv na změnu hmotnosti, tj. že rozdíl středních hodnot hmotnosti se neliší. logo-IBA 4. Příklad k procvičení —Načtěte data 04_4_priklad. Dle studie se zkoumá vliv léku - hydrochlorothiazidu na krevní tlak v náhodném výběru 11 hypertoniků (člověk trpící vysokým tlakem krve). Každý pacient dostal nejprve placebo a o měsíc později hydrochlorothiazid. Uvedené hodnoty v datech představují systolický tlak (v mm Hg). 1.Na hladině významnosti 0,05 testujte hypotézu, že lék neměl významný vliv na změnu krevního tlaku. logo-IBA logomuni •5. Příklad k procvičení —Načtěte data 04_5_priklad. Výrobce udává, že průměrná spotřeba paliva je 12,5 l/100 km. Testovací jezdec podrobil 14 vybraných vozů měření spotřeby. 1.Na hladině významnosti 0,05 otestujte, zda se skutečná spotřeba tohoto automobilu odlišuje od toho, co udává výrobce. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Výsledky samostatného cvičení Samostatné cvičení – vyhodnocení logo-IBA 1. Příklad k procvičení —Načtěte data 04_1_priklad. U 21 lidí byla zjištěna výška postavy. Výsledky měření považujeme za realizace náhodného výběru z normálního rozložení. — 1.Na hladině významnosti testujte hypotézu, že střední hodnota výšky lidí je 175 cm proti oboustranné alternativě. Před provedením testu ověřte normalitu dat pomocí N-P plotu a Shapirova-Wilkova (S-W) testu. 2.Na hladině významnosti testujte hypotézu, že střední hodnota výšky lidí je 181 cm proti oboustranné alternativě. 3. logo-IBA 1. Příklad k procvičení 1. H0: μ = 175 cm; HA: μ ≠ 175 cm 2. H0: μ = 181 cm; HA: μ ≠ 181 cm 1. úkol – jednovýběrový t-test (α = 0,05): H0 nezamítáme. Neprokázali jsme, že by střední hodnota výšky lidí byla statisticky významně odlišná od 175 cm. H0 zamítáme. Prokázali jsme, že se v našem výběrovém souboru střední hodnota výšky lidí statisticky významně liší od 181 cm. Ověření normality – Shapiro-Wilkův test (α = 0,05): Nezamítáme nulovou hypotézu o tom, že výběrový soubor pochází z normálního rozdělení (p = 0,464). 2. úkol – jednovýběrový t-test (α = 0,05): logo-IBA 2. Příklad k procvičení —Načtěte data 04_2_priklad, která obsahují následující sloupce: 1. sloupec - výška v 1. skupině, 2. sloupec - výška v 2. skupině, 3. sloupec - výška, 4. sloupec - skupina (1-muži, 2-ženy). — 1.Ověřte normalitu výšky v 1. skupině a ve 2. skupině pomocí N-P plotu a histogramu, teprve potom pomocí testů. 2.Na hladině významnosti 0,05 testujte hypotézu, že rozptyly výšek skupiny 1 a 2 jsou shodné. 3.Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty výšek skupiny 1 a 2 jsou shodné. 4.Výstupy doplňte krabicovými grafy (box-ploty). 5. logo-IBA 2. Příklad k procvičení 1. úkol - ověření normality – Shapiro-Wilkův test (α = 0,05): Nezamítáme nulovou hypotézu o tom, že výběrový soubor (skupina 1) pochází z normálního rozdělení (p = 0,077). Nezamítáme nulovou hypotézu o tom, že výběrový soubor (skupina 2) pochází z normálního rozdělení (p = 0,343). A146.emf 504B.emf logo-IBA 2. Příklad k procvičení 2. úkol – testování shody rozptylů - F-test / Levenův test (α = 0,05): Nezamítáme nulovou hypotézu o tom, že jsou rozptyly výběrových souborů shodné (skupina 1 a skupina 2). F-test: p = 0,905, Levenův test: p=0,791 3. úkol – dvouvýběrový t-test (α = 0,05): H0: μ1 = μ2; HA: μ1 ≠ μ2 Zamítáme nulovou hypotézu o shodě středních hodnot dvou výběrových souborů. Střední hodnota výšky skupiny 1 je statisticky významně větší než u skupiny 2 (p < 0,001). 4. úkol – krabicové grafy: F12C.emf logo-IBA 3. Příklad k procvičení —5 žen vyzkoušelo novou dietu. Načtěte data 04_3_priklad, který obsahuje následující údaje: 1. sloupec- hmotnost před dietou, 2. sloupec - hmotnost po dietě. — 1.Na hladině významnosti 0,05 testujte hypotézu, že dieta neměla významný vliv na změnu hmotnosti, tj. že rozdíl středních hodnot hmotnosti se neliší. logo-IBA 3. Příklad k procvičení Ověření normality – Shapiro-Wilkův test (α = 0,05): Nezamítáme nulovou hypotézu o tom, že diference pochází z normálního rozdělení (p = 0,607). 1. úkol - párový t-test (α = 0,05): H0: μpřed - μpo = 0; HA: μpřed - μpo ≠ 0 Zamítáme nulovou hypotézu, dieta měla statisticky významný vliv na změnu hmotnosti (průměrné snížení o 4,6 kg), p = 0,009. N-P graf diferencí Bodový graf - korelace logo-IBA 4. Příklad k procvičení —Načtěte data 04_4_priklad. Dle studie se zkoumá vliv léku-hydrochlorothiazidu na krevní tlak v náhodném výběru 11 hypertoniků (člověk trpící vysokým tlakem krve). Každý pacient dostal nejprve placebo a o měsíc později hydrochlorothiazid. Uvedené hodnoty v datech představují systolický tlak (v mm Hg). 1.Na hladině významnosti 0,05 testujte hypotézu, že lék neměl významný vliv na změnu krevního tlaku. logo-IBA 4. Příklad k procvičení Ověření normality – Shapiro-Wilkův test (α = 0,05): Nezamítáme nulovou hypotézu o tom, že diference pochází z normálního rozdělení (p = 0,493). 1. úkol - párový t-test (α = 0,05): H0: μlék - μplacebo = 0; HA: μlék - μplacebo ≠ 0 Zamítáme nulovou hypotézu, lék měl statisticky významný vliv na hodnotu krevního tlaku (průměrné snížení o 24 mm Hg), p < 0,001. N-P graf diferencí Bodový graf - korelace ECCC.emf logo-IBA logomuni •5. Příklad k procvičení —Načtěte data 04_5_priklad. Výrobce udává, že průměrná spotřeba paliva je 12,5 l/100 km. Testovací jezdec podrobil 14 vybraných vozů měření spotřeby. 1.Na hladině významnosti 0,05 otestujte, zda se skutečná spotřeba tohoto automobilu odlišuje od toho, co udává výrobce. logo-IBA logomuni Ověření normality – Shapiro-Wilkův test (α = 0,05): Nezamítáme nulovou hypotézu o tom, že výběrový soubor pochází z normálního rozdělení (p = 0,953). 1. úkol - jednovýběrový t-test (α = 0,05): H0: μ = 12,5 l/100km; HA: μ ≠ 12,5 l/100km Zamítáme nulovou hypotézu, p < 0,001. Na základě výběrového souboru jsme prokázali, že spotřeba automobilu je vyšší než udává prodejce (průměrná spotřeba je o 1,4 l/100km vyšší, než udává prodejce). •5. Příklad k procvičení