logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Test dobré shody Fisherův přesný test McNemar test Kontingenční tabulky logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace —Analýza kontingenčních tabulek umožňuje analyzovat vazbu mezi dvěma kategoriálními proměnnými. Základním způsobem testování je tzv. chí-kvadrát test (chí-kvadrát test dobré shody), který srovnává pozorované četnosti kombinací kategorií oproti očekávaným četnostem, které vychází z teoretické situace, kdy je vztah mezi proměnnými náhodný. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Test dobré shody - základní teorie pozorovaná četnost očekávaná četnost očekávaná četnost = + 2 pozorovaná četnost očekávaná četnost očekávaná četnost 1. jev 2. jev - 2 - + … pozorovaná četnost očekávaná četnost očekávaná četnost = 2 - ∑ logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Test dobré shody - základní teorie Binomické jevy (1/0) pozorovaná četnost očekávaná četnost očekávaná četnost = + 2 pozorovaná četnost očekávaná četnost očekávaná četnost I. jev 1 II. jev 2 - 2 - Příklad 10 000 lidí hází mincí rub: 4 000 případů (R) líc: 6 000 případů (L) Lze výsledek považovat za statisticky významně odlišný (nebo neodlišný) od očekávaného poměru R : L = 1 : 1 ? Rozdíl je vysoce statisticky významný (p << 0,001] Tabulková hodnota: logo-IBA —Máme dvě nominální proměnné, X (má r variant) a Y (má s variant) —Kontingenční tabulka typu r x s — — — — — — — —Speciální případ: čtyřpolná tabulka (dvě proměnné, každá se dvěma kategoriemi) — Kontingenční tabulka I Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek y[1] ….. ….. y[s] nj. x[1] n11 ….. ..... n1s n1. . . ….. ….. . . . . ….. ….. . . x[r] nr1 ….. ….. nrs nr. n.k n.1 . . n.s n x[j] y[k] logo-IBA Kontingenční tabulka II Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek —Kontingenční tabulka umožňuje testování následujících hypotéz: — 1.Hypotézu o nezávislosti, 2.Hypotézu o shodnosti struktury (test homogenity) 3.Hypotézu o symetrii — — — — — — — — logo-IBA Testování nezávislosti I Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek —Motivace: Souvisí spolu výskyt dvou nominálních znaků měřených na jediném výběru? —Příklad: Barva očí (modrá, zelená, hnědá) a barva vlasů (hnědá, černá, blond) u vybraných 30 studentů jsou nezávislé. —Nulová hypotéza: Znaky X a Y jsou nezávislé náhodné veličiny. —Alternativní hypotéza: Znaky X a Y jsou závislé náhodné veličiny. —Test: Pearsonův chí-kvadrát — — — Očekávané (teoretické) četnosti ejk : •H0 zamítáme na hladině významnosti α, pokud •Předpoklady testu ? H0 platí logo-IBA Testování nezávislosti II Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek —Předpoklady Pearsonova chí-kvadrát testu: 1.Jednotlivá pozorování shrnutá v kontingenční tabulce jsou nezávislá, tj. každý prvek patří jen do jedné buňky kont. tabulky, nemůže zároveň patřit do dvou. 2.Podmínky dobré aproximace: Očekávané (teoretické) četnosti jsou aspoň v 80 % případů větší nebo rovné 5 a ve 100 % případů nesmí být pod 2. (Pokud není tento předpoklad splněn, je vhodné sloučit kategorie s nízkými četnostmi). —Měření síly závislosti: Cramérův koeficient: Význam hodnot: 0-0,1….zanedbatelná závislost 0,1-0,3…slabá závislost 0,3-0,7…střední závislost 0,7-1 silná závislost • 1. 1. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Kontingenční tabulky: příklad Očekávané četnosti: FA = 102 * 30 / 166 = 18,43 FB = 102 * 136 / 166 = 83,57 FC = 11,57 FD = 52,43 Ano Ne S Ano 20 82 102 Ne 10 54 64 S 30 136 166 gen … Kontingenční tabulka v obrázku Gen: ANO Gen: NE logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 1: Řešení v softwaru Statistica I —Na hladině významnosti 0,05 testujte hypotézu o nezávislosti genu a stavu pacienta. Simultánní četnosti znázorněte graficky. • 1. 1. • V menu Statistics zvolíme Basic statistics, Vybereme Tables and banners logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 1: Řešení v softwaru Statistica II • Vybereme proměnné, které chceme testovat logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 1: Řešení v softwaru Statistica III • Na záložce Options zaškrtneme Expected frequencies (Očekávané četnosti) (k ověření podmínek dobré aproximace) • • • Zaškrtneme Pearsonův chí-kvadrát • Pokud chceme vypočítat i Cramérův koeficient zaškrtneme Phi & Cramer‘s V • Poté se vrátíme na záložku Advanced, kde a zvolíme Detailed two-way tables • logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Příklad 1: Řešení v softwaru Statistica IV Tab.1: Pozorované četnosti Jsou splněny podmínky dobré aproximace? Tab. 3: Paersonův chí-kvadrát p- hodnota Hodnota testové statistiky Počet stupňů volnosti http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png ANO Tab. 2: Očekávané četnosti logo-IBA —Máme dvě nominální veličiny, X (má dvě varianty) a Y (má dvě varianty) —Kontingenční tabulka typu 2 x 2 — — — — — —Definice: podíl šancí (odds ratio) Jestliže asymptotický 100(1-α)% interval spolehlivosti neobsahuje 1, pak hypotézu o nezávislosti zamítáme na hladině významnosti α. —Test: Fisherův přesný (exaktní) test (slouží též k testování v tabulce r x s, když nemáme splněny podmínky dobré aproximace) — Čtyřpolní tabulky Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek y[1] y[2] nj. x[1] a b a+b x[2] c d c+d n.k a+c b+d n Výsledek pokusu okolnosti nj. I II úspěch a b a+b neúspěch c d c+d n.k a+c b+d n logo-IBA Řešení v softwaru Statistica: Fisherův přesný test Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek • Na záložce Options zaškrtneme Fisher exact • • Výstupní tabulka Pro jednostranný test http://files.mscck-trmice.webnode.cz/200000297-22250231ed/vyk%C5%99i%C4%8Dn%C3%ADk.png Pro oboustranný test logo-IBA Testování homogenity (testování shody struktury) Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek —Motivace: Zajímá nás výskyt nominálního znaku u r nezávislých výběrů z r různých populací. —Příklad: Je zájem o sport stejný u děvčat jako u chlapců? —Nulová hypotéza: pravděpodobnostní rozdělení kategoriální proměnné je stejné v různých populací —Test: Pearsonův chí-kvadrát — Dívky Chlapci Zájem o sport Ano a b a+b Ne c d c+d a+c b+d n Některé marginální četnosti (buď sloupcové nebo řádkové) jsou předem pevně stanoveny logo-IBA Testování homogenity: příklad I Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Očkování proti chřipce se zúčastnilo 460 dospělých, z nichž 240 dostalo očkovací látku proti chřipce a 220 dostalo placebo. Na konci experimentu onemocnělo 100 lidí chřipkou, 20 z nich bylo z očkované skupiny a 80 z kontrolní skupiny. Je to dostatečný důkaz, že očkovací látka byla účinná? Nulová hypotéza: Procento výskytu chřipky je v očkované a kontrolní skupině stejné. logo-IBA Test hypotézy o symetrii (McNemarův test pro čtyřpolní tabulku) Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek —Motivace: Na osobách sledujeme binární proměnnou před pokusem a po něm, cílem je zjistit, zda došlo ke změně v rozdělení této proměnné. —Analýza párových dichotomických proměnných — — — — — — —Nulová hypotéza: , pokus nemá vliv na výskyt daného znaku —Testová statistika: pokud je větší než kritická hodnota rozdělení o jednom stupni volnosti (vhodné pro počty údajů b+c > 8), pak nulovou hypotézu zamítáme — — po + - nj. před + a b a+b - c d c+d n.k a+c b+d n Četnostní tabulka Tabulka teoretických pravděpodobností po + - před + p11 p12 p1. - p21 p22 p2. p.1 p.2 logo-IBA Mc Nemarrův test: příklad I Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Zjistěte, zda výuka o pozitivním působení sportu na zdraví vede ke změně postojů žáků ke sportování. Nulová hypotéza: Počet žáků, kteří změní svůj postoj pozitivním směrem, je pouze náhodně odlišný od počtu žáků, kteří změní svůj postoj negativním směrem. Závěr: Výuka má pozitivní vliv na postoj žáků vzhledem k provozování sportu. Postoj po výuce + - Postoj před výukou + 5 3 8 - 16 2 18 21 5 26 Tabulky: H0 zamítnuta