M6120 Lineární statistické modely ii Jaro 2017 Cvičení 6 27. březen 2017 Cvičení 1. Ze stránky http: //www. statsci. org/data/general/f ullmoon.txt získejte data fullmoon, zopakujte si, co znamenají jednotlivé proměnné a jaké jsou mezi nimi vztahy. Nafi-tujte v R model Jth1 Pro závislost počtu pacientů pohotovostní služby psychiatrické kliniky na měsíci v roku (nazvěme jej model .year). Zopakujte si interpretaci parametrů /3q, /3±,..., /3n. Cvičení 2. Podívejte se na litované střední hodnoty denního počtu pacientů pohotovostní služby psychiatrické kliniky v jednotlivých měsících seřazené chronologicky. (a) Uvažujte, jestli by mělo smysl modelovat závislost středních hodnot na měsících uvažovaných jako spojitou proměnnou. (b) Rozmyslete si, jakou funkční závislost byste v takovém případě zvolili a nafitujte vybraný model. (c) Jaká funkční závislost by vedla na model ekvivalentní modelu model.year? (d) Bylo by možné některé hypotézy o funkční závislosti testovat i přímo v rámci modelu model.year? Cvičení 3. Zaměříme se na párová porovnávání (rozdíly mezi středními hodnotami pro jednotlivé dvojice měsíců). Zkonstruujte konfidenční intervaly a testy pro rozdíly středních hodnot pomocí (a) Fisherovy LSD metody, (b) Scheffého metody, (c) Tukeyho HSD metody. Zopakujte si teoretické zdůvodnění jednotlivých metod a z toho odvoďte očekávání o jejich chování v praxi. Graficky porovnejte konfidenční intervaly získané na základě jednotlivých metod a zamyslete se nad tím, jestli je jejich chování na datech fullmoon v souladu s vašimi očekáváními. Tip: Můžete si pomoct přednáškou z týdne 7 z podzimního semestru a přednáškami z jarního semestru. Cvičení 4. (a) Uvažujte náhodné jevy A\,..., A^. Omezte pravděpodobnost sjednocení Uí=i shora a odvoďte platnost Bonferroniho korekce p-hodnoty při mnohonásobném porovnávání. (b) Uvažujte nezávislé náhodné jevy A±,..., A\.. Spočtěte pravděpodobnost průniku P|í=i ^* a odvoďte platnost Sidákovy korekce p-hodnoty při mnohonásobném porovnávání. Cvičení 5. Spočtěte p-hodnoty a konfidenční intervaly ze Cvičení 3 pomocí Bonferroniho metody a srovnejte výsledky s těmi, které jste dostali ve Cvičení 3. 1 M6120 Lineární statistické modely ii Jaro 2017 Domácí úloha {10 bodů) Při testování m hypotéz se setkáváme se situací, kterou můžeme zapsat pomocí následující tabulky. Nesignifikantní Signifikantní Pravdivá Hq Nepravdivá Hq U V T S m0 m — itiq m- R R m Číslo m známe a m — R neznáme, náhodnou veličinu R pozorujeme, zatím co náhodné veličiny U, V a S nepozorujeme. Dvě nejčastěji kontrolovaná kritéria při mnohonásobném testování můžeme pomocí značení z tabulky zapsat jako FWER = P (V > 1) a FDR = E(Q), kde Q = V/R, je-li R > 0 a Q = 0 jinak. Různé metody mnohonásobného porovnávání jsou většinou navrženy tak, aby kontrolovaly FWER nebo FDR. (a) Dokažte, že je-li itiq = m, pak FDR = FWER. Z toho plyne, že metody mnohonásobného porovnávání kontrolující FDR kontrolují také FWER v slabém smyslu (t.j. za předpokladu, že všechny nulové hypotézy jsou pravdivé). (b) Dokažte, že je-li itiq < m, pak FDR < FWER. Z toho plyne, že metody mnohonásobného porovnávání kontrolující FWER kontrolují také FDR. Naopak, metody mnohonásobného porovnávání kontrolující FDR nekontrolují FWER v silném smyslu (t.j. bez ohledu na to, kolik nulových hypotéz je pravdivých). Na druhou stranu mají tyto metody potenciál pro větší sílu než ty, které kontrolují FWER v silném smyslu, jelikož rozdíl mezi veličinami, jejíchž střední hodnoty se v definicích FWER a FDR počítají, lze očekávat tím větší, čím větší je počet nulových hypotéz, které neplatí. Bonferroniho metoda kontroluje FWER v silném smyslu a Sidákova metoda kontroluje FWER v silném smyslu za předpokladu nezávislosti jednotlivých testových statistik. K populárním metodám kontrolujícím FDR patří Benjaminiho-Hochbergova metoda. Při ní se získané p-hodnoty seřadí od nejmenší po největší. Je-li P^ i-tá nejmenší p-hodnota a je-li k největší i, pro které platí, že P^ < i/m x q, pak zamítneme k hypotéz s nejmenšími p-hodnotami. Benjaminiho-Hochbergova metoda kontroluje FDR na hladině q v silném smyslu za předpokladu nezávislosti testových statistik. U Benjaminiho-Hochbergovy metody jde o takzvanou step-down proceduru. Začneme tím, že vezmeme největší p-hodnotu a je-li ta menší než q, zamítneme všechny hypotézy, jako bychom dělali testování bez úpravy na mnohonásobná porovnávání. Je-li větší než q, podíváme se na druhou největší p-hodnotu a v nejhorším případě postupujeme až k nejmenší p-hodnotě. Příslušnou hypotézu zamítneme, je-li tato menší než q/m, jako bychom používali Bonferroniho korekci. Jinou populární step-down procedurou je Hochbergova metoda. Ta postupuje podobně jako Benjaminiho-Hochbergova, ale místo hranice i/m x q srovnává i-tou nejmenší p-hodnotu s hranicí ij{m + 1 — i) x a. Hochbergova metoda kontroluje FWER na hladině a v silném smyslu za předpokladu nezávislosti testových statistik. Není těžké si rozmyslet, že zamítne nejvýše tolik hypotéz co Benjaminiho-Hochbergova metoda. 2