Ověřování exponenciálního a Poissonova rozložení Test dobré shody Testujeme hypotézu, která tvrdí, že náhodný výběr X[1], ..., X[n] pochází z rozložení s distribuční funkcí Φ(x). a) Je-li distribuční funkce spojitá, pak data rozdělíme do r třídicích intervalů , j = 1, ..., r. Zjistíme absolutní četnost n[j] j-tého třídicího intervalu a vypočteme pravděpodobnost p[j], že náhodná veličina X s distribuční funkcí Φ(x) se bude realizovat v j-tém třídicím intervalu. Platí-li nulová hypotéza, pak p[j] = Φ(u[j+1]) - Φ(u[j]). b) Má-li distribuční funkce nejvýše spočetně mnoho bodů nespojitosti, pak místo třídicích intervalů použijeme varianty x[[j]], j = 1, …, r. Pro variantu x[[j]] zjistíme absolutní četnost n[j] a vypočteme pravděpodobnost p[j], že náhodná veličina X s distribuční funkcí Φ(x) se bude realizovat variantou x[[j]]. Platí-li nulová hypotéza, pak . Testová statistika: . Platí-li nulová hypotéza, pak K ≈ χ^2(r-1-p), kde p je počet odhadovaných parametrů daného rozložení. (Např. pro normální rozložení p = 2, protože z dat odhadujeme střední hodnotu a rozptyl.) Nulovou hypotézu zamítáme na asymptotické hladině významnosti α, když K ≥ χ^2[1-α](r-1-p). Aproximace se považuje za vyhovující, když np[j] ≥ 5, j = 1, ..., r. Upozornění: Hodnota testové statistiky K je silně závislá na volbě třídicích intervalů. Navíc při nesplnění podmínky np[j] ≥ 5, j = 1, ..., r je třeba některé intervaly resp. varianty slučovat, což vede ke ztrátě informace. Jednoduchý test exponenciálního rozložení Testujeme hypotézu, která tvrdí, že náhodný výběr X[1], ..., X[n] pochází z exponenciálního rozložení. Označme M výběrový průměr a S^2 výběrový rozptyl tohoto náhodného výběru. Víme, že střední hodnota náhodné veličiny X ~ Ex(λ) je E(X) = 1/λ a rozptyl je D(X) = 1/λ^2. Test založíme na statistice , která se v případě platnosti H[0] asymptoticky řídí rozložením χ^2(n-1). Kritický obor: . Jestliže , H[0] zamítáme na asymptotické hladině významnosti α. Jednoduchý test Poissonova rozložení Testujeme hypotézu, která tvrdí, že náhodný výběr X[1], ..., X[n] pochází z Poissonova rozložení. Označme M výběrový průměr a S^2 výběrový rozptyl tohoto náhodného výběru. Víme, že střední hodnota náhodné veličiny X ~ Po(λ) je E(X) = λ a rozptyl je D(X) = λ. Test založíme na statistice , která se v případě platnosti H[0] asymptoticky řídí rozložením χ^2(n-1). Kritický obor: . Příklad 1.: Byla zkoumána doba životnosti 45 součástek (v hodinách). Výsledky jsou uvedeny v tabulce rozložení četností: +----------------------------------------------------------------+ |Doba životnosti |Počet součástek | |--------------------------------+-------------------------------| |(0, 50] |15 | |--------------------------------+-------------------------------| |(50, 100] |14 | |--------------------------------+-------------------------------| |(100, 150] |6 | |--------------------------------+-------------------------------| |(150, 200] |5 | |--------------------------------+-------------------------------| |(200, 250] |2 | |--------------------------------+-------------------------------| |(250, 300] |1 | |--------------------------------+-------------------------------| |(300, 350] |1 | |--------------------------------+-------------------------------| |(350, 400] |1 | +----------------------------------------------------------------+ Na asymptotické hladině významnosti 0,05 testujte hypotézu, že daný náhodný výběr pochází z exponenciálního rozložení. Použijte a) test dobré shody, b) jednoduchý test exponenciálního rozložení (využijte toho, že z původních dat byl vypočten průměr m = 99,93 a rozptyl s^2 = 7328,91). Výsledky: ad a) Protože nejsou splněny podmínky dobré aproximace pro j = 4, 5, 6, 7, 8, je třeba sloučit třídicí intervaly 4 až 8 do jednoho. K = 1,5153, , H[0] nezamítáme na asymptotické hladině významnosti 0,05. ad b) K = 32,2924, H[0] nezamítáme na asymptotické hladině významnosti 0,05. Příklad 2.: Studujeme rozložení počtu pacientů, kteří během 75 dnů přijdou na pohotovost. Osmihodinovou pracovní dobu rozdělíme do půlhodinových intervalů a v každém intervalu zjistíme počet příchozích pacientů: +----------------------------------------------------------------------+ |Počet pacientů |Pozorovaná četnost | |---------------------------------+------------------------------------| |0 |79 | |---------------------------------+------------------------------------| |1 |188 | |---------------------------------+------------------------------------| |2 |282 | |---------------------------------+------------------------------------| |3 |275 | |---------------------------------+------------------------------------| |4 |196 | |---------------------------------+------------------------------------| |5 |114 | |---------------------------------+------------------------------------| |6 |45 | |---------------------------------+------------------------------------| |7 |10 | |---------------------------------+------------------------------------| |8 |7 | |---------------------------------+------------------------------------| |9 |3 | |---------------------------------+------------------------------------| |10 |1 | +----------------------------------------------------------------------+ Na asymptotické hladině významnosti 0,05 testujte hypotézu, že daný náhodný výběr pochází z Poissonova rozložení. Použijte a) test dobré shody, b) jednoduchý test Poissonova rozložení. Výsledky: ad a) Protože nejsou splněny podmínky dobré aproximace, je třeba sloučit poslední tři varianty do jedné. K = 8,5217, , H[0] nezamítáme na asymptotické hladině významnosti 0,05. ad b) K = 1158,47, H[0] nezamítáme na asymptotické hladině významnosti 0,05.