M6120 Lineární statistické modely ii Jaro 2017 Cvičení 4 13. březen 2017 Cvičení 1. Ze stránky http: //www. statsci. org/data/general/f ullmoon.txt získejte data f ullmoon, zopakujte si, co znamenají jednotlivé proměnné a jaké jsou mezi nimi vztahy. Na-fitujte v R model model.0 ze cvičení z minulého týdne (model Th0 z přednášky), t.j. Yí=ii + eí, i = l,...,N (1) kde £j *~ N(0,cr2), a model model. 1 ze cvičení z minulého týdne (model Fh1 z přednášky), t.j. Y ji = fi + a j +£ji, j = 1,.. •, J; i = 1,... ,rij, (2) kde Eij ~ N(0,o-2). Cvičení 2. S využitím teoretických výpočtů ze Cvičení 3 a 4 z minulého týdne spočtěte kvantity z těchto cvičení pro data fullmoon a najděte spočtené hodnoty ve výstupech z funkcí (a) summary(model.0); (b) summary(model.1); (c) anova(model.1); (d) anova(model.0, model.1); (e) aov; (f) oneway.test. Cvičení 3. Uvažujte model Jth1 Pro data fullmoon. Následující tabulka udává odhad koeficientu, příslušnou směrodatnou odchylku, pozorovanou hodnotu t statistiky pro test hypotézy o nulovosti koeficientu proti oboustranné alternativě a příslušnou p-hodnotu pro f^Beíorei QTjuring QTiefore & QíAfter ^Before- Estimate Std. Error t value Pr(>|t|) (Intercept) 10.9167 1.2138 8.994 2.15e-10 *** MoonDuring 2.5000 1.7165 1.456 0.155 MoonAfter 0.5417 1.7165 0.316 0.754 Spočtěte Stejnou tabulku pro /iBefore, /-íDuring a AíAfter- Cvičení 4. Uvažujte model Th1 W° data fullmoon. Zopakujte si, jakou designovou matici R defaultně použije a ověřte si to pomocí příkazu model .matrix. Použijete-li v zadání příkazu lm, části formula znak —1, zakážete R použít absolutní člen, t.j. zakážete, aby první sloupec designové matice byl sloupcem jedniček. S využití této volby můžete R přinutit, aby použilo designovou matici, která povede na parametrizaci modelu Jth1 přímo pomocí /iRefore, AíDuring & /iAfter, t.j. Y ji = fij + e ji, j = 1,..., J', i = 1,..., n j. (3) N arit uj t e tento model (nazvěme jej model. 2) v R a porovnejte summary (model. 2) s výsledky ze Cvičení 3 a se summary (model. 1). 1 M6120 Lineární statistické modely ii Jaro 2017 Cvičení 5. Vraťme se nyní k definici modelu Jth1 pomocí (2), t.j. s koeficienty fi,a±,..., aj. Zopakujme si, že designová matice takového modelu má dimenzi n x (J+l) a hodnost J, a tedy existuje nekonečně mnoho voleb vektoru odhadů (/i, a±,..., áj), které minimalizují součet čtverců Ylj=i YliĹi(Yjí~®j)2- Jednoznačně odhadnutelných parametrů v modelu Tux je J, konkrétně střední hodnoty jednotlivých skupin fi±, fi2, ■ ■ ■ > A4 j a jejich lineární kombinace jsou jednoznačně odhadnutelné. Kdybychom ale model Th1 chtěli parametrizovat přímo pomocí koeficientů fi±,..., fij, t.j. pomocí (3) dostali bychom model bez absolutního členu. Vzhledem k nevýhodám, které tato volba obnáší (viz Cvičení 4), obvykle volíme parametrizaci modelu J~Hi pomocí absolutního členu /3q a dalších J — 1 parametrů /3±,... ,/3j_i. Skupinové střední hodnoty //i,//2> • • • > A4 j jsou funkcemi parametrů /3o>/3i> • • • >/3/-i- Prozkoumejte vztah mezi /3o,/3i, • • • ,/3j-i a /íi,/í2, • • •, fJ.j- Uvědomte si, že vztah mezi (30,(3i,... ,/3j_i a /xi,/x2, ■■■,fJ-j musí být vzájemně jednoznačný. V ANOVA se /3±,..., /3j_i často volí jako lineární kombinace /ii, /i2, • • •, Aíj, jejíchž koeficienty jsou kolmé na vektor jedniček (tvoří ortogonální kontrasty). Cvičení 6. R umožňuje uživateli zvolit si parametrizaci /3±,..., /3j-i. V parametru contrasts funkce lm můžeme přímo zadat, jak mají vypadat řádky designové matice pro pozorování z jednotlivých skupin. Jde vlastně o matici dimenze J x (J — 1), kterou zprava pronásobíme designovou matici parametrizace (2) tak, abychom dostali novou designovou matici s plnou sloupcovou hodností1. Použijte znalosti získané ze Cvičení 5 na to, abyste si za pomoci volby contrasts nechali nafitovat model Jth1 parametrizovaný tak, aby A) = Ar, fil — /^During /^Before, h = A^After — A^During • Všimněte si, že koeficienty srovnávají po sebe jdoucí fáze měsíce. Zajímalo-li by nás jenom srovnání úplňku proti dvěma zbylým fázím, bylo by jednodušší použít volby relevel v části formula. Domácí úloha {15 bodů) Uvažujte model Jth1 Pro data fullmoon, tentokrát ale modelujte vliv kalendářního měsíce na počet pacientů. Parametrizujte model tak, aby koeficienty odpovídaly srovnání zimních měsíců proti Vánocům a letních měsíců proti školním prázdninám. Přiložte zdrojový kód v R a výstup funkce summary. Tip: User-friendly manuál k volbě kontrastů v R najdete například na této webové stránce: http: //rstudio-pubs-static. s3. amazonaws. com/65059_586f39Ji.d8éb8Ji.f8Ji.bíbaaf56ffb6bJi.rIf. html. 1Mluvili jsme o ní v přednášce z týdne liz podzimního semestru, částí o výběru řešení pro model s neúplnou hodností. 2