8. Parametrické úlohy o více nezávislých náhodných výběrech 8.1. Více nezávislých náhodných výběrů z normálních rozložení 8.1.1. Motivace: Zajímáme se o problém, zda lze určitým faktorem (tj. nominální náhodnou veličinou Y, která má varianty y[1], ..., y[r], r?3, vysvětlit variabilitu pozorovaných hodnot náhodné veličiny X, která je intervalového či poměrového typu. Např. zkoumáme, zda počet dětí (náhodná veličina Y) ovlivňuje průměrné roční výdaje rodiny na průmyslové zboží (náhodná veličina X). Provede se tedy náhodný výběr odpovídající variantě y[1] atd. až náhodný výběr odpovídající variantě y[r]. Přitom předpokládáme, že se řídí rozložením N(ěj, ó2), j = 1, ..., r a že jednotlivé náhodné výběry jsou stochasticky nezávislé. Na hladině významnosti á testujeme nulovou hypotézu, která tvrdí, že všechny střední hodnoty jsou stejné proti alternativní hypotéze, která tvrdí, že aspoň jedna dvojice středních hodnot se liší. Jedná se tedy o zobecnění dvouvýběrového t-testu a na první pohled se zdá, že stačí utvořit dvojic náhodných výběrů a na každou dvojici aplikovat dvouvýběrový t-test. Tento postup však nelze použít, neboť nezaručuje splnění podmínky, že pravděpodobnost chyby 1. druhu je á. Proto ve 30. letech 20. století vytvořil R. A. Fisher metodu ANOVA (analýza rozptylu, v popsané situaci konkrétně analýza rozptylu jednoduchého třídění), která uvedenou podmínku splňuje. Pokud na hladině významnosti á zamítneme nulovou hypotézu, zajímá nás, které dvojice středních hodnot se od sebe liší. K řešení tohoto problému slouží metody mnohonásobného porovnávání, např. Scheffého nebo Tukeyova metoda. 8.1.2. Vlastnosti statistik odvozených z výběrových průměrů a výběrových rozptylů Nechť ~ N(ěj, ó2), j = 1, 2, ..., r jsou nezávislé náhodné výběry. Označme celkový rozsah všech r výběrů, výběrový průměr a výběrový rozptyl j-tého výběru, j = 1, ..., r. Dále označme vážený průměr výběrových rozptylů a celkový průměr všech r výběrů. Součet se nazývá reziduální součet čtverců a charakterizuje variabilitu uvnitř jednotlivých výběrů. Součet se nazývá skupinový součet čtverců a charakterizuje variabilitu mezi jednotlivými výběry. Součet se nazývá celkový součet čtverců a charakterizuje variabilitu jednotlivých pozorování kolem celkového průměru. Platí: ST = SE + SA. Důkaz: 8.1.3. Test hypotézy o shodě středních hodnot Na hladině významnosti á testujeme H0: ě1 = ... = ěr proti H1: aspoň jedna dvojice středních hodnot se liší. Platí-li H0, pak a) nestranným odhadem společné střední hodnoty ě je celkový průměr b) nestranným odhadem rozptylu ó2 je statistika c) statistika ~ ÷2(r-1) d) statistika ~ F(r-1, n-r). H0 tedy zamítáme na hladině významnosti á, když F ? F1-á(r-1, n- r). Důkaz: Nechť platí H0. ad a) Označme ě společnou střední hodnotu. Počítáme . Tedy M je nestranný odhad ě. ad b) Statistika je tedy nestranným odhadem ó2. ad c) Náhodná veličina, která vznikne standardizací Mj či M, má standardizované normální rozložení (Mj resp. M je totiž lineární kombinací náhodných veličin s normálním rozložením). Součet kvadrátů stochasticky nezávislých náhodných veličin s rozložením N(0,1) má rozložení ÷2 s počtem stupňů volnosti rovným počtu sčítanců. V našem případě je sčítanců r-1, dostáváme tedy veličinu s rozložením ÷2(r-1). ad d) Zobecněním 7.1.1. c) dostaneme, že statistika ~ ÷2(n-r). Platí-li H0, má statistika ~ ÷2(r-1) (viz bod b) a přitom SE a SA jsou stochasticky nezávislé. Tedy ~ F(r-1, n- r), pokud H0 platí. Když H0 platí, bude podíl blízký 1, protože SA/(r-1) je nestranný odhad ó2 a SE/(n-r) je nestranný odhad ó2 (bez ohledu na platnost H0). Není-li H0 pravdivá, čitatel vzroste, protože rozdílnost středních hodnot se projeví větší variabilitou výběrových průměrů kolem celkového průměru. Jmenovatel ovšem zůstane týž, proto testové kritérium F bude nabývat hodnot větších než 1. Jelikož hladina významnosti je á, bude mít kritický obor tvar: . 8.1.4. Tabulka jednofaktorové analýzy rozptylu Bývá zvykem zapisovat výsledky do tabulky ANOVA. Zdroj Součet Stupně podíl F variability čtverců volnosti skupiny SA r-1 SA/(r-1) reziduální SE n-r SE/(n-r) - celkový ST n-1 - - 8.1.5. Bartlettův a Levenův test shody rozptylů Před provedením analýzy rozptylu je zapotřebí ověřit předpoklad o shodě rozptylů v daných r výběrech. Levenův test: Položme . Označíme . Platí-li hypotéza o shodě rozptylů, pak statistika ~ F(r-1, n- r). H0 tedy zamítáme na hladině významnosti á, když FZ ? F1-á(r- 1, n-r). Bartlettův test: Platí-li hypotéza o shodě rozptylů, pak statistika ~ ÷2(r-1), kde . H0 zamítáme na hladině významnosti á, když B ? ÷21-á(r-1, n-r). 8.1.6. Metody mnohonásobného porovnávání Zamítneme-li na hladině významnosti á hypotézu o shodě středních hodnot, chceme zjistit, které dvojice středních hodnot se liší na dané hladině významnosti á. Mají-li všechny výběry týž rozsah p (říkáme, že třídění je vyvážené), použijeme Tukeyovu metodu: rovnost středních hodnot ěk a ěl zamítneme na hladině významnosti á, když , kde hodnoty q1-á(r, n-r) najdeme ve statistických tabulkách. Nemají-li všechny výběry stejný rozsah, použijeme Scheffého metodu: rovnost středních hodnot ěk a ěl zamítneme na hladině významnosti á, když . Pozor, může nastat situace, kdy při zamítnutí H0 nenajdeme významný rozdíl u žádné dvojice středních hodnot. Pak je významně rozdílná některá složitější kombinace středních hodnot. 8.1.6. Příklad U čtyř odrůd brambor (označených symboly A, B, C, D) se zjišťovala celková hmotnost brambor vyrostlých vždy z jednoho trsu. Výsledky (v kg): odrůda hmotnost A 0,9 0,8 0,6 0,9 B 1,3 1,0 1,3 C 1,3 1,5 1,6 1,1 1,5 D 1,1 1,2 1,0 Na hladině významnosti 0,05 testujte hypotézu, že střední hodnota hmotnosti trsu brambor nezávisí na odrůdě. Zamítnete-li nulovou hypotézu, zjistěte, které dvojice odrůd se liší na hladině významnosti 0,05. Řešení Data považujeme za realizace čtyř nezávislých náhodných výběrů ze čtyř normálních rozložení se stejným rozptylem. Testujeme hypotézu, že všechny čtyři střední hodnoty jsou stejné. M1 = 0,8, M2 = 1,2, M3 = 1,1, M = 1,14, SE = 0,3, SA = 0,816, ST = 1,116, F = 9,97, F0,95(3,11) = 3,59. Protože testová statistika se realizuje v kritickém oboru, H0 zamítáme na hladině významnosti 0,05. Výsledky zapíšeme do tabulky ANOVA Zdroj Součet Stupně podíl F variability čtverců volnosti skupiny SA = 0,816 3 SA/3 = = 9,97 0,272 reziduální SE = 0,3 11 SE/11 = - 0,02727 celkový ST = 1,116 14 - - Nyní pomocí Scheffého metody zjistíme, které dvojice odrůd se liší na hladině významnosti 0,05. Srovnávané odrůdy Rozdíly Pravá strana vzorce A, B 0,4 0,41 A, C 0,67 0,36 A, D 0,3 0,41 B, C 0,2 0,40 B, D 0,1 0,44 C, D 0,3 0,40 Na hladině významnosti 0,05 se liší odrůdy A a C. 8.1.7. Význam předpokladů v analýze rozptylu a) Nezávislost jednotlivých náhodných výběrů -- velmi důležitý předpoklad, musí být splněn, jinak dostaneme nesmyslné výsledky. b) Normalita -- ANOVA není příliš citlivá na porušení normality, zvlášť pokud mají všechny výběry rozsah nad 20 (důsledek centrální limitní věty). Při výraznějším porušení normality se doporučuje Kruskalův -- Wallisův test. c) Shoda rozptylů -- mírné porušení nevadí, při větším se doporučuje Kruskalův -- Wallisův test. Test shody rozptylů má smysl provádět až po ověření předpokladu normality. 8.2. Více nezávislých náhodných výběrů z alternativních rozložení 8.2.1. Test homogenity binomických rozložení Nechť ~ A(), j = 1, 2, ..., r jsou nezávislé náhodné výběry. Testujeme hypotézu H0: proti alternativní hypotéze H1: aspoň jedna dvojice parametrů je různá. Označme celkový rozsah všech r výběrů a M* vážený průměr výběrových průměrů. Jako testové kritérium slouží statistika , která v případě platnosti nulové hypotézy má asymptoticky rozložení ÷2(r-1). H0 tedy zamítáme na asymptotické hladině významnosti á, když Q ? ÷21- á(r-1). Test lze použít, pokud njM* > 5 pro všechna j = 1, ..., r. Statistiku Q lze snadno upravit do Brandtova -- Snedecorova výpočetního tvaru . Důkaz: Jak bylo ukázáno v 6.3.1., statistika ? N(0,1). Nechť platí H0. Označme společnou hodnotu všech parametrů , j = 1, 2, ..., r. Pak statistika ? N(0,1) a ? ÷2(1). Lze ukázat, že statistika ? ÷2(r-1). Parametr však neznáme, nahradíme ho váženým průměrem výběrových průměrů a dostaneme ? ÷2(r-1). Kritický obor tedy bude . 8.2.2. Test homogenity binomických rozložení založený na arkussinusové transformaci Není-li splněna podmínka njM* > 5 pro všechna j = 1, ..., r, doporučuje se následující postup: označme , Aj = arcsin ?Yj, j = 1, ..., r, . Pak statistika ? ÷2(r-1). H0 tedy zamítáme na asymptotické hladině významnosti á, když Q ? ÷21-á(r-1). 8.2.3. Mnohonásobné porovnávání Zamítneme-li nulovou hypotézu na asymptotické hladině významnosti á, chceme zjistit, které dvojice parametrů se liší. Platí-li nerovnost , pak na hladině významnosti á zamítáme hypotézu o shodě parametrů . (Hodnoty q1-á(r, ?) najdeme v tabulkách.) 8.2.4. Příklad Na gymnázium bylo přijato 142 studentů. Ti byli náhodně rozděleni do čtyř tříd A, B, C, D. V každé třídě byla matematika vyučována jinou metodou. Na konci školního roku psali všichni studenti stejnou písemnou práci a byl zaznamenán počet těch studentů, kteří vyřešili všechny zadané úkoly. Třída A B C D Počet studentů 35 36 37 34 Počet úspěšných studentů 5 8 17 15 Na asymptotické hladině významnosti 0,05 testujte hypotézu, že rozdíly mezi třídami jsou způsobeny pouze náhodnými vlivy. Řešení Máme čtyři nezávislé náhodné výběry, j-tý pochází z rozložení A(), j = 1, 2, 3, 4. Testujeme hypotézu H0: . Přitom n1 = 35, n2 = 36, n3 = 37, n4 = 34, m1 = 5/35, m2 = 8/36, m3 = 17/37, m4 = 15/34, m* = (5+8+17+15)/142 = 45/142. Testová statistika Q = 12,288, ÷20,95(3) = 7,81. Protože testové kritérium se realizuje v kritickém oboru, H0 zamítáme na asymptotické hladině významnosti 0,05. Protože v jednom případě není splněna podmínka njm* > 5, použijeme ještě test založený na arkussinusové transformaci. A1 = 0,388, A2 = 0,491, A3 = 0,745, A4 = 0,768, B = 0,588. Pak Q = 13,227 a H0 opět zamítáme na asymptotické hladině významnosti 0,05. Nyní metodou mnohonásobného porovnávání zjistíme, které dvojice parametrů se od sebe liší na hladině významnosti 0,05. Srovnávané třídy Rozdíly Pravá strana vzorce A, B 0,103 0,30 A, C 0,357 0,30 A, D 0,339 0,31 B, C 0,254 0,30 B, D 0,254 0,31 C, D 0,018 0,30 Na hladině významnosti 0,05 se liší třídy A, C a A, D. Příklady k 8. kapitole Příklad 1.: Jsou známy měsíční tržby (v tisících Kč) tří prodavačů za dobu půl roku. 1. prodavač: 12 10 9 10 11 9 2. prodavač: 10 12 11 12 14 13 3. prodavač: 19 18 16 16 17 15 Na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty tržeb všech tří prodavačů jsou stejné. Pokud zamítneme nulovou hypotézu, zjistěte, tržby kterých dvou prodavačů se liší na hladině významnosti 0,05. Řešení m1 = 10,17, m2 = 12, m3 = 16,83, m = 13, s12 = 1,37, s22 = 2, s32 = 2,17, SE = 27,7, SA = 142,3, ST = 170, F = 38,58, F0,975(2,015) = 3,6823, H0 tedy zamítáme na hladině významnosti 0,05. Výsledky zapíšeme do tabulky ANOVA Zdroj Součet Stupně podíl F variability čtverců volnosti skupiny SA = 142,3 2 SA/2 = = 38,58 71,17 reziduální SE = 27,7 15 SE/15 = - 1,84 celkový ST = 170 17 - - Nyní pomocí Tukeyovy metody zjistíme, které dvojice prodavačů se liší na hladině významnosti 0,05. Srovnávaní prodavači Rozdíly Pravá strana vzorce 1, 2 1,83 2,68 1, 3 6,67* 2,68 2, 3 4,83* 2,68 Pravá strana: , kde Na hladině významnosti 0,05 se liší tržby prodavačů 1, 3 a 2, 3. Příklad 2.: 99 náhodně vybraných matek bylo dotázáno, zda jejich kojenec dostává dudlík. Zjišťoval se též nejvyšší stupeň dosaženého vzdělání matky. Vzdělání matky Počet matek Počet dětí s dudlíkem Základní 39 27 Středoškolské 47 34 Vysokoškolské 18 15 Na asymptotické hladině významnosti 0,05 testujte hypotézu, že podíly dětí s dudlíkem nezávisí na vzdělání matky. Řešení n1 = 39, n2 = 47, n3 = 18, m1 = 27/39, m2 = 34/47, m3 = 15/18, m* = (27+34+15)/99 = 76/99. Testová statistika Q = 1,085, kvantil ÷20,95(2) = 5,992. Protože testové kritérium se nerealizuje v kritickém oboru, H0 nezamítáme na asymptotické hladině významnosti 0,05. Práce se systémem STATISTICA Téma: Parametrické úlohy o více nezávislých náhodných výběrech (analýza rozptylu jednoduchého třídění) Vzorový příklad: V jisté továrně se měřil čas, který potřeboval každý ze tří dělníků k uskutečnění téhož pracovního úkonu. Čas v minutách:1. dělník: 3,6 3,8 3,7 3,5, 2. dělník: 4,3 3,9 4,2 3,9 4,4 4,7, 3. dělník: 4,2 4,5 4,0 4,1 4,5 4,4. Na hladině významnosti 0,05 testujte hypotézu, že výkony těchto tří dělníků jsou stejné. Zamítnete-li nulovou hypotézu, určete, výkony kterých dělníků se liší na dané hladině významnosti. Návod: Vytvořte datový soubor se dvěma proměnnými (X a ID) a 16 případy. Do 1. sloupce napište změřené časy, do 2. sloupce dejte čtyřikrát jedničku, šestkrát dvojku a šestkrát trojku. Statistics - Basic Statistics and Tables - Breakdown & one-way ANOVA - Variables Dependent X, Grouping ID, OK, Codes for grouping variables -- All, OK, Quick -- Summary: Table of statistics (zobrazí se průměry, směrodatné odchylky a rozsahy všech tří výběrů) -- návrat do Statistics by Groups -- Categorized box & whisker plot (současné zobrazení krabicových diagramů pro všechny tři výběry -- změna typu krabicového diagramu se provede po dvojnásobném kliknutí myší na graf v menu Plot:Box/Whisker) -- návrat do Statistics by Groups -- ANOVA & tests -- Categorized normal prob. plots (vizuální posouzení normality všech výběrů) -- návrat do Statistics by Groups -- Levene tests (testování homogenity rozptylů všech tří výběrů - p-hodnota = 0,256, tedy na hladině významnosti 0,05 se nezamítá hypotézu o shodě rozptylů) -- návrat do Statistics by Groups -- Analysis of Variance (provední analýzy rozptylu). Ve výstupní tabulce je použito následující označení: SS Effect ... skupinový součet čtverců SA, MS Effect ... SA/(r-1), SS Error ... reziduální součet čtverců SE, MS Error ... SE/(n-r). Protože p- hodnota = 0,00268, zamítá se na hladině významnosti 0,05 hypotézu o shodě středních hodnot. Návrat do Statistics by Groups -- Post- hoc -- Scheffé test. Výsledek Scheffého metody ukazuje, že na hladině významnosti 0,05 se liší výkony dělníků (1,2), (1,3) a neliší se (2,3). Příklady k samostatnému řešení: 1. Studenti byli vyučováni předmětu za využití pěti pedagogických metod: tradiční způsob, programová výuka, audiotechnika, audiovizuální technika a vizuální technika. Z každé skupiny byl vybrán náhodný vzorek studentů a všichni byli podrobeni témuž písemnému testu. Na hladině významnosti 0,05 testujte hypotézu, že znalosti všech studentů jsou stejné a nezávisí na použité pedagogické metodě. V případě zamítnutí hypotézy zjistěte, které výběry se liší na hladině významnosti 0,05. metoda počet bodů tradiční 76,2 48,3 85,1 63,7 91,6 87,2 programová 85,2 74,3 76,5 80,3 67,4 67,9 72,1 60,4 audio 67,3 60,1 55,4 72,3 40 audiovizuální 75,8 81,6 90,3 78 67,8 57,6 vizuální 50,5 70,2 88,8 67,1 77,7 73,9 2. Pan Novák může cestovat z místa bydliště do místa pracoviště třemi různými způsoby: tramvají (způsob A), autobusem (způsob B) a metrem s následným přestupem na tramvaj (způsob C). Máme k dispozici jeho naměřené časy cestování do práce v době ranní špičky (včetně čekání na příslušný spoj) v minutách. Způsob A: 32, 39, 42, 37, 34, 38, B: 30, 34, 28, 26, 32, C: 40, 37, 31, 39, 38, 33, 34 Pro všechny tři způsoby dopravy vypočtěte průměrné časy cestování. Na hladině významnosti 0,05 testujte hypotézu, že doba cestování do práce nezávisí na způsobu dopravy. V případě zamítnutí nulové hypotézy zjistěte, které způsoby dopravy do práce se od sebe liší na hladině významnosti 0,05.