1 * Testy hypotéz - úvod as VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Statistika v průzkumném studiu Provádění odhadů Závěr ? Reprezentativnost 9 Ověření popis /l V^ Výsledek as Testy hypotéz Cílová pop " Závěr ? Interpretace OTÁZKY VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rnA Elementární prvky statistických testů Nulová hypotéza H0 Alternativní hypotéza HA Testová statistika t = X - JU sjn ^> Kritický obor testované statistiky VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Experimentální design Optimální velikost vzorku nebo počet opakování *\ Efektivní uspořádání experimentů Účelná minimalizace chyb 1 Závěr testu Q_ Q. (1) Z Platí 1-a Neplatí a ß i-ß as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Experimentální design Pravděpodobnost chyby 1.druhu a 1 P nesprávného zamítnutí nulové hypotézy Pravděpodobnost chyby 2. druhu ß i P nerozpoznáni platné nulové hypotézy Síla testu i-ß i Pravděpodobnostně vyjádřená schopnost rozpoznat neplatnost hypotézy as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Predpoklady a pojmy statistických testů - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Parametrické vs. neparametrické testy Mají předpoklady o rozložení vstupujících dat (např. normální rozložení) Při stejném N a dodržení předpokladů mají vyšší sílu testu než testy neparametrické Pokud nejsou dodrženy předpoklady parametrických testů, potom jejich síla testu prudce klesá a výsledek testu může být zcela chybný a nesmyslný Neparametrické testy Nemají předpoklady o rozložení vstupujících dat, lze je tedy použít i při asymetrickém rozložení, odlehlých hodnotách, či nedetekovatelném rozložení Snížená síla těchto testů je způsobena redukcí informační hodnoty původních dat, kdy neparametrické testy nevyužívají původní hodnoty, ale nejčastěji pouze jejich pořadí VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rnA One-sample vs. two sample testy Srovnávají jeden vzorek (one sample, jednovýběrově testy) s referenční hodnotou (popřípadě se statistickým parametrem cílové populace) V testu je tedy srovnáváno rozložení hodnot (vzorek) s jediným číslem (referenční hodnota, hodnota cílové populace) Otázka položená v testu může být vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek Two - sample testy Srovnávají navzájem dva vzorky (two sample, dvouvýběrové vzorky) V testu jsou srovnávány dvě rozložení hodnot Otázka položená v testu může být opět vztažena k průměru, rozptylu, podílu hodnot i dalším statistickým parametrům popisujícím vzorek Kromě testů pro dvě skupiny hodnot existují samozřejmě i testy pro více skupin dat VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rnA One-tailed vs. Two-tailed testy Hypotéza testu je postavena asymetricky, tedy ptáme se na větší než/ menší než Test může mít pouze dvojí výstup -jedna z hodnot je větší (menší) než druhá a všechny ostatní případy Kritický obor Two - tailed testy Hypotéza testu se ptá na otázku rovná se/nerovná se Test může mít trojí výstup - menší - rovná se - větší než Situace nerovná se je tedy souhrnem dvou možných výstupů testu (menší+větší) Kritický obor VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ m* Nepárový vs. Párový design Nepárový design Skupiny srovnávaných dat jsou na sobě zcela nezávislé (též nezávislý, independent design), např. lidé z různých zemí, nezávislé skupiny pacientů s odlišnou léčbou atd. Při výpočtu je nezbytné brát v úvahu charakteristiky obou skupin dat nepárový „. two sample test x: Párový design Mezi objekty v srovnávaných skupinách existuje vazba, daná např. člověkem před a po operaci, reakce stejného kmene krys atd. Vazba může být buď přímo dána nebo pouze předpokládána (v tom případě je nutné ji ověřit) Test je v podstatě prováděn na diferencích skupin, nikoliv na jejich původních datech Diference XI X2 xiaX2 Párový ■ y two sample -*^ tes I VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Testy normality Testy normality pracují s nulovou hypotézou, že není rozdíl mezi zpracovávaným rozložením a normálním rozložením. Vždy je ovšem dobré prohlédnout si i histogram, protože některé odchylky od normality, např. bimodalitu některé testy neodhalí. 250 200 150 100 145 155 165 175 185 195 205 215 •Test dobré shody V testu dobré shody jsou data rozdělena do kategorií (obdobně jako při tvorbě histogramu), tyto intervaly jsou normalizovány (převedeny na normální rozložení) a podle obecných vzorců normálního rozložení jsou k nim dopočítány očekávané hodnoty v intervalech, pokud by rozložení bylo normální. Pozorované normalizované četnosti jsou poté srovnány s očekávanými četnostmi pomocí %2 testu dobré shody. Test dává dobré výsledky, ale je náročný na n, tedy množství dat, aby bylo možné vytvořit dostatečný počet tříd hodnot. •Kolgomorov Smirnov test Tento test je často používán, dokáže dobře najít odlehlé hodnoty, ale počítá spíše se symetrií hodnot než přímo s normalitou. Jde o neparametrický test pro srovnání rozdílu dvou rozložení. Je založen na zjištění rozdílu mezi reálným kumulativním rozložením (vzorek) a teoretickým kumulativním rozložením. Měl by být počítán pouze v případě, že známe průměr a směrodatnou odchylku hypotetického rozložení, pokud tyto hodnoty neznáme, měla by být použita jeho modifikace - Lilieforsův test. •Shapiro-Wilk s test Jde o neparametrický test použitelný i při velmi malých n (10) s dobrou sílou testu, zvláště ve srovnání s alternativními typy testů, je zaměřen na testování symetrie. VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Sikmost a špičatost jako testy normality Parametry normálního rozložení, skewness a kurtosis mohou být využity pro testování normality, ale pouze pro velké vzorky (šikmost - 100, špičatost-500). skewness>0 skewness<0 kurtosis<0 VÝUKA: Biostatistika - základní kurz kurtosis>0 CENTRUM BIOSTATISTIKY A ANALÝZ fSs as VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA "One sample " testy V případě one sample testů jde o srovnání výběru dat (tedy one sample) s cílovou populací. Pro parametrické testy musí mít datový soubor normální rozložení. o S3 Průměr - cílová vs. výběrová populace H0 HA Testová statistika Interval spolehlivosti X jU t t>vr X> jU X < jU t túr ť Xl-a/2 2 2 X < Xa/2 nebo VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r»A "One sample" testing vs one/two tailed ■=> > a = 0,05 0 GU ^ -et/2 Pokud "two - tailed" test vyjde významný tak, že P < 0,05, pak dobře zvolený "one - tailed" test je významný při P < 0,025. ■-----x . . . tzn.že testová charakteristika > Qi_a/2 a "one - tailed" testy na hladině jsou v podstatě zbytečné. O Pokud je pro "two - tailed" test P = 0,1, pak lze na hladině a = 0,05 prokázat nerovnost srovnávaných parametrů vhodně voleným "one - tailed" testem. 9E3 tzn. že testová charakteristika e (9i * 9 VÝUKA: Biostatistika - základní kurz \-a' l-or/2/ CENTRUM BIOSTATISTIKY A ANALÝZ r»A Srovnání odhadu průměru s předpokládanou hodnotou I Koncentrace antibiotika v cílovém orgánu Při 1000 měřeních antibiotika byla zjištěna v cílovém orgánu průměrná koncentrace 202,5 jednotek a směrodatná odchylka 44 jednotek. Požadovaná koncentrace antibiotika je 200 jednotek. 1) Je daný rozdíl 2,5 významný vzhledem k variabilitě znaku na hladině významnosti 5%? 2) Jaká je skutečná hladina významnosti? t = ^-tL ^n = ^ VTÖÖÖ = 1,797 s 44 VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Srovnání odhadu průměru s předpokládanou hodnotou II Aktivita enzymu v buňkách Při zjišťování aktivity enzymu v buňkách na vzorku 25 měření byl zjištěn průměr 3,5 jednotek a směrodatná odchylka 1. 1. otázka zní, zda se naměřené hodnoty našeho vzorku liší od výsledků dřívější rozsáhlé studie zaměřené na celou cílovou populaci, kde byla zjištěna průměrná aktivita 2,5 jednotky? HO: x=\i tedy two tailed test s 1 t™975 = 2,064 E^> t > t\\n C^> HO zamítnuta při a<0,05 0,975 -?~v . |---^ v ^ *\-ai2 od jiné hodnoty bychom zachytili při daných hodnotách? 2. otázka -jakou minimální odchylku X od jiné hodnoty bychom zachytili při daných hodnotách? x — u r- d t =---------Vft =—yin ť d = -^s d = 2-^x 3. za předpokladu, že z praktického hlediska je významná odchylka již 0,2 jednotky, jaký minimálni počet měření musíme provést, abychom ji byli schopni prokázat ? x-u r- d r ^ t=------^n=—yln+ n = d s v- Y l-a/2 d as VYUKA: Biostatistika - základní kurz V " J CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Srovnání odhadu průměru s předpokládanou hodnotou III x: Aktivita enzymu v buňkách n = 25; x = 3,5; s= 1 li: Hodnota zjištěná při předcházejícím, dlouhodobém průzkumu z H0: x = li t = 3,5 - 2,5 V25~= 5 t t>\ (24) * Ll-a/2 T H0 zamítnuta při a < 0,05 as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rnA Srovnání odhadu průměru s předpokládanou hodnotou IV Situace: Odhad průměrné hodnoty znaku X w Jakou minimální odchylku X od nějaké jiné hodnoty zachytíme jako významnou při daném n, a, b ? d = s n \t\-a 12 + tl-ß ) Nechť a = 0,05; ß = 0,10; n = 25 ; s2 = 1,5682 ti-a/2 (24) = 2,064 t1_B(24)= 1,318 d = 1.5682 25 (2,064 + 1,318 ) = 0,85 VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Statistické testy o parametrech dvou výběrů - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Two sample testy Při použití two sample testů srovnáváme spolu dvě rozložení. Jejich základním dělením je podle designu experimentu na testy párové a nepárové. nepárový y. two sample test " # Ü Základním testem pro srovnání dvou nezávislých rozložení spojitých čísel je nepárový two-sample t-test Diference XI X2 xiaX2 \ .» . Párový \------*** • i y two sample I • «» • test Základním testem pro srovnání dvou závislých rozložení spojitých čísel je párový two-sample t-test VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Xi x Srovnání dvou pokusných variant - obecné schéma zapojených testů L x1 x2 Nezávislé uspořádání ^ Design uspořádání zásadně ovlivňuje interpretaci parametrů as /"" "N V. J Hq . ]Xy — \i2 nx n s2 s: XrX2=D r ~\ Párové uspořádání ^, 1^:0=0 n D 2 SD (n = n2 = n1) VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Srovnání dvou pokusných variant - obecné schéma zapojených testů II. Identifikace párovitosti (Korelace, Kovariance) x1 x Xi Xi Ji. ••• • • ••• r = 0,954 (p < 0,001) X. r = 0,218 (p < 0,812) X. S3 VYUKA: Biostatistika-základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ fňA Předpoklady nepárového two sample t-testu Náhodný výběr subjektů jednotlivých skupin z jejich cílových populací Nezávislost obou srovnávaných vzorků Přibližně normální rozložení proměnné ve vzorcích, drobné odchylky od normality ovšem nejsou kritické, test je robustní proti drobným odchylkám od tohoto předpokladu, normalita může být testována testy normality Rozptyl v obou vzorcích by měl být přibližně shodný (homoscedastic). Tento předpoklad je testován několika možnými testy - Levenův test nebo F-test. Vždy je vhodné prohlédnout histogramy proměnné v jednotlivých vzorcích pro okometrické srovnání a ověření předpokladů normality a homogenity rozptylu - nenahradí statistické testy, ale poskytne prvotní představu. x • ZĽ + + VÝUKA: Biostatistika - základní kurz Varianta 1 Varianta 2 CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Nepárový two sample t-test - výpočet 1 1. 2. nulová hypotéza: průměry obou skupin jsou shodné, alternativní hypotéza je, že nejsou shodné, two tailed test prohlédnout průběh dat, průměr, medián apod. pro zjištění odchylek od normality a nehomogenita rozptylu, provést F -test F-test pro srovnání dvou výběrových rozptylů •Používá se pro srovnání rozptylu dvou skupin hodnot, často za účelem ověření homogenity rozptylu těchto skupin dat. H0 HA Testová statistika Gx >a2 2 2 ax <722 2 2 cr2 < cr2 2 2 er2 * g\ s2 ^2 j2 F - 2 _ max( s\, s22) 3 9 9 min( 5,1 ,s2) „2 _ («i-iW+c^-1)^2 «! + n2 - 2 2 2 2 S2 fT ° 2 S2 r a 12 VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Two sample testing - nezávislý t-test Ha = X\ IX2 0 1) a2 = a2 => s2 = ("l ~V'S* + ("2 _1)'s2 _ ssi + ss p ....... vx+v2 nl + n2 - 2 2) s 3) t = hl «2 X 1 — X 2 ^F,-F2 = s p n 2 + nx nx • t?2 jux - ju2: Xi - Xi ± t («!+«2-2) l-cr/2 'Xi-X2 Pokud (T^ ^ a 2 ■ nelze vyjádřit s p p , /> x 1- x 2 + n , n VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Two sample t-test - príklad Průměrná hmotnost ovcí v čase páření byla srovnávána pro kontrolní skupinu a skupinu krmenou zvýšenou dávkou potravy. Kontrolní skupina obsahuje 30 ovcí, skupina se zvýšeným příjmem potravy pak 24 ovcí. Vlastní experiment byl prováděn tak, že na začátku máme 54 ovcí (ideálně stejného plemene, stejně staré atd.), které náhodně rozdělíme do dvou skupin (náhodné rozdělování objektů do pokusných skupin je objektem celého specializovaného odvětví statistiky nazývaného randomizace). Poté co experiment proběhne, musíme nejprve ověřit teoretický předpoklad pro využití nepárového t-testu. Pro obě proměnné jsou vykresleny grafy (můžeme též spočítat základní popisnou statistiku), na kterých můžeme posoudit normalitu a homogenitu rozptylu, kromě okometrického pohledu můžeme pro ověření normality použít testy normality, pro ověření homogenity rozptylu pak F-test Pokud platí všechny předpoklady Two sample nepárového t-testu, můžeme spočítat testovou charakteristiku, výsledné t je 2,43 s 52 stupni volnosti, podle tabulek je a t0975(52)= 2,01, tedy t> t0975(52)= a nulovou hypotézu můžeme zamítnout, skutečná pravděpodobnost je pak 0,018. Rozdíl mezi skupinami je 1,59 kg ve prospěch skupiny s lepší výživou. Rozdíl _ průrůmě SE(rozdílprůo éru) X\-X2 Knx 1 1 —+ — n {nx-\)s\+{n2-\)s nx +n2 o = nl+n2 i j Pro rozdíl mezi oběma soubory jsou spočítány 95% konfidenční intervaly jako 1,59±2.01*(0,655) kg, což odpovídá rozsahu 0,28 až 2,91 kg. To, že konfidenční interval nezahrnuje 0 je dalším potvrzením, že mezi skupinami je významný rozdíl -jde o další způsob testování významnosti rozdílů mezi skupinami dat - nulovou hypotézu o tom, že rozdíl průměrů dvou skupin dat je roven nějaké hodnotě zamítáme v případě, kdy 95% konfidenční interval rozdílu nezahrnuje tuto hodnotu (v tomto případě 0). Ol - *2 ) ± h.9lßE(XX - X2 ) = Ol - X2 ) ± h 1 1 —+ — n, n Vi 2 J as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Neparametrické alternativy nepárového t-testu X1 X2 ALL Rank ALL X1 rank X2 rank 27 25 25 5 6 5 35 29 29 7,5 11 7,5 38 31 31 9 13 9 37 23 23 4 12 4 39 18 18 2 14 2 29 17 17 1 7,5 1 41 32 32 10 15 10 19 19 3 3 27 6 35 11 38 13 37 12 39 14 29 7,5 41 15 Mann Whitney U-test •Stejně jako řada jiných neparametrických testů počítá i tento test s pořadím dat v souborech namísto s originálními daty. Jde o neparametrickou obdobu nepárového t-testu a z těchto neparametrických testů má nejvyšší sílu testu (95% párového t-testu). •V případě Mann-Whitney testu jsou nejprve čísla obou souborů sloučena a je vytvořeno jejich pořadí v tomto sloučeném souboru, pak jsou hodnoty vráceny do původních souborů a nadále se pracuje již jen s jejich pořadím. •Pro oba soubory je tedy vytvořen součet pořadí a menší z obou součtů je porovnán s kritickou hodnotou testu, pokud je tato hodnota menší než kritická hodnota testu, zamítáme nulovou hypotézu shody distribučních funkcí obou skupin. •Podobným způsobem je počítán i Wilcoxon rank sum test (pozor, existuje ještě Wilcoxnův párový test!!!) VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rnA Man - Whitney test "Změna počtu buněk po aplikaci preparátu: A 276, 3511, 3813, 3712, 3914, 2975, 4115 Kontrolní skupina: B 255, 2975, 319, 234, 182, 171, 3210, 193 RA .......součet pořadí pro skupinu A = 78,5 RB .......= 41,5 UA=ni'n2 ^fa+1) -RA=7 + 7-8 -RA = 5,5 UA+UB -r\ -n2 ^>UB =50,5 min( UA;UB) = 5,5 [n[=7;n2=fl] Pokud je min(UA; UB) menší než kritická hodnota testu, pak zamítáme hypotézu shody distribučních funkcí obou skupin VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Mann - Whitney test -příklad 17 štěňat bylo trénováno v chození na záchod metodou pozitivního posilování (pochvala, když jde na záchod venku) nebo negativního (trest, když jde na záchod doma). Jako parametr bylo měřeno, za kolik dní je štěně vycvičeno. nulová hypotéza je, že není rozdíl v metodách tréninku, tedy, že oběma metodami je štěně vycvičeno za stejnou dobu. po srovnání rozložení + malý počet hodnot je vhodné použít neparametrický test je vytvořeno pořadí sloučených hodnot pořadí hodnot v jednotlivých skupinách dat je sečteno a menší ze součtů je použit pro srovnání s kritickou hodnotou testu výsledkem testu je p o > CO ■o 0 8 o 80 75 70 65 60 55 50 45 40 35 30 pozitivně negativné o o o 8 8 VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r»A Párové two sample testy -předpoklady • Skupiny dat jsou spojeny přes objekt měření, příkladem může být měření parametrů pacienta před léčbou a po léčbě (nemusí jít přímo o stejný objekt, dalším příkladem mohou být např. krysy ze stejné linie). • Oba soubory musí mít shodný počet hodnot, protože všechna měření v jednom souboru musí být spárována s měřením v druhém souboru. Při vlastním výpočtu se potom počítá se změnou hodnot (diferencí) subjektů v obou souborech. • Před párovým testem je vhodné ověřit si zda existuje vazba mezi oběma skupinami - vynesení do grafu, korelace. Existuje několik možných designů experimentu, stručně lze sumarizovat: 1. pokus je párový a jako párový se projeví 2. párové provedení pokusu - párově se neprojeví • možná párovost není • špatně provedený pokus - malé n, velká variabilita, špatný výběr jedinců 3. čekali jsme nezávislé a jsou 4. čekali jsem nezávislé a nejsou • vazba • náhoda VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r-BA Párový two sample t-test Tento test nemá žádné předpoklady o rozložení vstupních dat, protože je počítán až na základě jejich diferencí. Tyto diference by měly být normálně rozloženy a otázkou v párovém t-testu je, zda se průměrná hodnota diferencí rovná nějakému číslu, typicky jde o srovnání s nulou jako důkaz neexistence změny mezi oběma spárovanými skupinami. V podstatě jde o one sample t-test, kde místo rozdílu průměru vzorku a cílové populace je uveden průměr diferencí a srovnávané číslo (0 v případě otázky, zda není rozdíl mezi vzorky). Pro srovnání s 0 (testovou statistikou je t rozložení): f — — ^fyi V — n — \ s Někdy je obtížné rozhodnout, zda jde nebo nejde o párové uspořádání, párový test by měl být použit pouze v případě, že můžeme potvrdit vazbu (korelace, vynesení do grafu), jedním z důvodů proč toto ověřovat je fakt, že v případě párového t-testu není nutné brát ohled na variabilitu původních dvou souborů, tento předpoklad však platí pouze v případě vazby mezi proměnnými. Výpočet obou typů testů se vlastně liší v použité s, jednou jde o s diferencí, v druhém případě o složený odhad rozptylu obou souborů. Zda je párové uspořádání efektivnější lze určit na základě: - Síly vazby - Je-li sD výrazně menší než sx1.x2 0 0 0 Závislost je možné rozepsat pomocí vzorce: SD=<7X + 0 and HA < 0 Máme hodnoty hmotnostních změn u lidí, seřazené po užívání drog, které mají za následek ztrátu hmotnosti. Každá změna hmotnosti (v kg) je hmotnost po mínus hmotnost před užitím drogy. 0,2 -0,5 -1,3 -1,6 -0,7 0,4 -0,1 0,0 -0,6 -1,1 -1,2 -0,8 w = 12 Y = -0,61% s2 = 0,4008 kg2 '0,4008 kg2 ni0, s- = „/------ = 0,18% t = X-ju _-0,6lkg s- ~ 0,18% = -3389 v = n-l = ll ^0,05 (1),11 — ^' '"" Když t < -1,796 , zamítáme H0. 0,0025 < P(t < -3,389) < 0,005 ■1,796 The distribution of t for v=11, showing the critical region (shaded area) for a one-tailed test using a=0,05. (The critical value of t is-1,796.) as VYUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ ŕ-RA Neparametrická obdoba párového t-testu Wilcoxon test Jsou vytvořeny diference mezi soubory, je vytvořeno jejich pořadí bez ohledu na znaménko a poté je sečteno pořadí kladných a pořadí záporných rozdílů. Menší z těchto dvou hodnot je srovnána s kritickou hodnotou testu a pokud je menší než kritická hodnota testu, pak zamítáme hypotézu shody obou souborů hodnot. Pro test existuje aproximace na normální rozložení, ale pouze pro velká n>25. Menší _ suma _ diferencí - n{n + \) t = '«(« + 1)(2« + 1) 24 Před zásahem Po zásahu Změn a Absolutní pořadí 6 2 4 10 2,5 3 -0,5 1,5 6,3 5 1,3 6 8,1 9 -0,9 5 1,5 2 -0,5 1,5 3,4 4 -0,6 3 2,5 1 1,5 8 1,11 2 -0,89 4 2,6 4 -1,4 7 1 3 -2 9 as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Wilcoxonův test -přikladl člověk A B diference pořadí 1 142 138 4 4,5 2 140 136 4 4,5 3 144 147 -3 3 4 144 139 5 7 5 142 143 -1 1 6 146 141 5 7 7 149 143 6 9,5 8 150 145 5 7 9 142 136 6 9,5 10 148 146 2 2 A parametr krve před podáním léku B parametr krve po podání léku W+ Z pořadí kladných rozdílů = 51 W =4 W=min(W+;W.) = 4 počet párů = h = 10 Pokud je W menší než kritická hodnota testu, pak zam funkcí obou skupin. ítáme hypotézu shody distribučních m VÝUKA: Biosl tatistika - základní kun 7 CENTRUM BIOSTATISTIKY A ANALÝZ m* Wilcoxonův test -příklad II Byla testována nová dieta pro laboratorní krysy, při pokusu byl zjišťován její vliv na různých liniích krys, bylo proto zvoleno párové uspořádání kdy krysy v obou dietách jsou spojeny přes svoji linii, tj. na začátku byly dvojice krys stejné linie, jedna z nich byla náhodně přiřazena k dietě, druhá z dvojice pak do druhé diety. 1. nulová hypotéza je, že váha krys není ovlivněna použitou dietou, alternativní, že ovlivnění dietou existuje 2. spočítáme diference - tyto diference jsou nenormální a proto je vhodné využít neparametrický test 3. Spočítáme sumu pořadí kladných a záporných diferencí, zde je menší suma záporných diferencí - 31 4. výsledkem výpočtu je p>0,05 a tedy nemáme dostatečné důkazy pro zamítnutí nulové hypotézy, nelze říci, že by nová dieta byla efektivnější než stará 5. pro doplnění výsledků je vhodné zjistit také skutečnou velikost rozdílu hmotností ve skupinách, např. ve formě mediánu VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Znaménkový test -příklady I Párově uspořádaný experiment pro nominální data I. Dva preparáty, každý na 1/2 listu - sledovaná veličina: počet skvrn (hodnoceno pouze jako rozdíl) Počet skvrn A V V M V V M M V V V B M M V M M V V M M M V - větší; M - menší n = 10 listů s rozdílnými výsledky ^r A je větší: + n+ = 7 jev^ B je menší:- n.= 3 min(n+; n.) = 3 II. dvě protilátky z různých zdrojů (A;B) - aplikované na vzorek s antigenem n = 10 A + + - + - + - + + - B - - + - + + - - + - n - nenulových rozdílů: 6 -► A: n. = 4 A: n =2 min(n+; n.) = 2 as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Znaménkový test -příklady II Na konferenci veterinářů bylo předneseno,že průměrný čas konzultace je 12 minut. Následovala debata, zda je lepší použít medián nebo průměr. Jeden z nich se rozhodl ověřit teorii, že průměrná konzultace trvá 12 minut na vlastní praxi a zaznamenal si trvání svých 43 konzultací. K otestování hypotézy, že podíl konzultací kratších a delších než 12 minut použil znaménkový test. Délka konzultace Počet <12 22 12 6 >12 15 Celkem 43 Další výpočet probíhá obdobně jako v případě klasického znaménkového testu na diferencích dvou skupin dat. as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rnA Srovnání dvou pokusných zásah ů obecné schéma zapojených testů III Nezávislé uspořádání NE ANO NE X2 test Kolmogorov-Smirnov test Shapiro-Wilks test transformace -i ANO F-test neparametrické testy NE testy: t-test nezávislý aproximace Man - Whitney Mediánový test VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Srovnání dvou pokusných zásah ů - obecné schéma zapojených testů IV Párové uspořádání_________ Diference D t-test párový NE c2 test Kolmogorov-Smirnov test Shapiro-Wilks test neparametrické testy testy: Znaménkový test Wilcoxonův test as VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ r*JtA Principy statistického testovaní lze využít pro různé typy dat - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ Testování- typ dat Spojitá čísla - T test, Mann-Whitney test, Wilcoxon test, Znaménkový test atd. Binární data? Kategoriální data? - Výše zmíněné testy nelze použít - Základní přístupy testování lze ovšem použít i na tato data • Nulová a alternativní hypotéza • One sample a two sample testy Analýzy na binomickém rozložení Analýzy na Poissonově rozložení Analýza kontingenčních tabulek ^v VÝUKA: Biostatistika - základní kurz CENTRUM BIOSTATISTIKY A ANALÝZ rttA