Ústav matematiky a statistiky Přírodovědecká fakulta Masarykova univerzita Analýza prežívania Zadania domácich úloh Stanislav Katina katina@math.muni.cz 22. decembra 2014 Katina, S., 2014: Analýza prežívania 1 1 2 3 4 5 6 7 Inštrukcie k DÚ: Odovzdáva sa jeden pdf súbor nazvaný priezvisko-meno-text-analprez-2014.pdf (obsahuje riešenia príkladov, obrázky, Qt-kód napísaný v TprXu), jeden zdrojový súbor naprogramovaných funkcií priezvisko-meno-source-analprez-2014.r a jeden súbor Qt-kódu konkrétnych zadaní z DÚ priezvisko-meno-priklady-analprez-2014.r, ktorý používa tento zdrojový kód. Na písanie ®-kódu odporúčam TfrjX balíček listings a vytvoreniu prostredia v hlavičke dokumentu ako \lstset{language=R, 7 nastavenie jazyka R bas i cstyle =\f ootnot e s ize \ ttf amily , 7 typ pisma R-kodu commentstyle=\ttfamily\color{farbal}, 7 farba komentára k funkciám numberstyle=\color{farba2}\footnotesize , 7 farba a velkost cislovania numbers=left, 7 cislovanie vlavo stepnumber=1, 7 cislovanie po krokoch jedna frame=leftline, 7 vytvorenie lavej hraničnej čiary breaklines=true} 7 zalomenie riadkov a potom v texte medzi begin a end. D U je potrebné odovzdať 7 dni pred termínom skúšky, na ktorý sa prihlásite. Tabulka 1: Dáta AML skupina čas po kompletný relaps (v týždňoch) A 9,13,13+, 18, 23, 28+, 31,34,45+, 48,161+ B 5, 5, 8, 8,12,16+, 23, 27, 30, 33,43,45 Tabulka 2: Dáta Koncentrácie koncentrácie čas do objavenia sa nádoru (v týždňoch) 2.0 414 -, 41+, 47, 47+, 47+, 58, 58, 58, 100+, 117 1.5 434 -, 44+, 45+, 67, 68+, 136, 136, 150, 150, 150 0 734 -, 74+, 75+, 76, 76, 76+, 99, 166, 246+, Príklad 1 (/c-ty moment času prežívania) Nech nezáporná náhodná veličina T je charakterizovaná funkciou prežívania s (T). Nech je k-ty moment, E[Tk], konečný, E[Tk] < oo,k G N. a) Ukážte, že platí E [T] = ^íe^0 Pr(T > t) = J^íeNo 1 — F (T) = ^2te^0s{T). Použite pri tom definíciu strednej hodnoty E [T] = ^íe^01 Pr(í) a pomocné tvrdenie 1 + 1 + ... + 1 = J^=1 1 = t-krát b) Ukážte, že platí E[T] = jQ s (t) dt. Použite pri tom definíciu strednej hodnoty E [T] = fQ tf(t)dt, aplikujte vlastnosti súm z (a) ako aj J0°° s (í) dt = J^°(Jq ldx)s (í) dt. Výpočet Vám uľahčí metóda per-partes. c) Pomocou metódy per-partes ukážte, že E[Tk] = k J0°° tk~1s(t)dt. DÚ Príklad 2 (odvodenie charakteristík prežívania) (a) stredná hodnota zostatkového života - pomocou metódy per partes ukážte, že platí posledná rovnosť v nasledovnom vzťahu f,00 (u — t) f(u)du f,00 s(u)du (b) funkcia prežívania - ukážte, že platí posledná rovnosť v nasledovnom vzťahu b (t) = / xj(x)dx = exp I / \{x)dx = exp (—A(t)) =-— exp ' ' mrl{ť) \ Jq mrl{u (22. decembra 2014) Katina, S., 2014: Analýza prežívania 2 (c) riziko - ukážte, že platí posledná rovnosť v nasledovnom vzťahu A(ŕ) = -l-lnS(ŕ) = = (^™rl(t) + 1^ 1 (9í v ' S (t) \dt w J mrl(t)' (d) hustota - ukážte, že platí posledná rovnosť v nasledovnom vzťahu n, n 9 . w . f d . \ mrl(0) ( ŕ du f (t) = ~^S(t) = X(t)S(t) = ( -mrlit) + 1 ) / y> exp ' 1 dt w w w v<9ŕ Z (mrl(í))2 V i0 rnrl(u) Táto rovnosť vyplýva zo vzťahu f (t) = \(t)S(t) a z výsledku predchádzajúcich dvoch príkladov (b) a (c) . DÚ Príklad 3 (porovnanie odhadov funkcie prežívania) Použitím Taylorovho rozvoja (prvého rádu) mínus logaritmu A^a (t) ukážte, že AkmÍí) je prvým členom tohoto rozvoja. DU Príklad 4 (programovanie a aplikácia, rozptyl priemerného zostatkového života) (a) Naprogramujte v funkciu na výpočet odhadu rozptylu priemerného zostatkového života v čase t. (b) Vypočítajte odhadu rozptylu priemerného zostatkového života v čase t = 0 a t = 30 pre AML dáta (skupina A). DU Príklad 5 (programovanie a aplikácia, medián zostatkového života) (a) Naprogramujte v funkciu na výpočet odhadu mediánu zostatkového života v čase t. (b) Vypočítajte medián zostatkového života v čase t = 0 a t = 30 pre AML dáta (skupina A). DÚ Príklad 6 (programovanie a aplikácia, rozptyl mediánu zostatkového života) (a) Naprogramujte v ^11 funkciu na výpočet odhadu rozptylu mediánu zostatkového života v čase t. (b) Vypočítajte odhadu rozptylu mediánu zostatkového života v čase t = 0 a t = 30 pre AML dáta (skupina A). DÚ Príklad 7 (programovanie a aplikácia, IS a pásy spoľahlivosti pre S (t)) (a) Naprogramujte v algoritmus na výpočet Nairových 100 x (1 — a)% pásov spoľahlivosti pre funkciu prežívania v arcus-sínus ovej odmocninovej škále funkcie prežívania S (t), kde t G (to,tmaiX). Výsledok porovnajte s IS pre S (t) v škále S (t). Na obrázku zobrazte IS ako vertikálne úsečky v tvare písmena I v časoch zlyhania a pásy spoľahlivosti pomocou funkcie polygonO. DÚ Príklad 8 (asymptotická normalita S kw) Porovnajte v *@ asymptotické rozdelenie Skw s jej exaktným rozdelením pre (a) n\ = n2 = n3 = 5, (b) n\ = n2 = 5 a n3 = 50, (c) n\ = n2 = n3 = 50, (d) ni = n2 = 50 a n3 = 100 a (e) n\ = n2 = n3 = 100. Na výpočet asymptotickej hustoty použite funkciu dchisqO a na výpočet asymptotickej distribučnej funkcie použite funkcie dchisqO a cumsumO. Na výpočet exaktnej hustoty použite funkciu dwilcoxO a na výpočet exaktnej distribučnej funkcie použite funkciu dKruskalWallis () v knižnici SuppDists. Teoretické a exaktné rozdelenie superponujte v podobe (í) hustoty, (2) distribučnej funkcie a (3) qq-diagramu s qq-priamkou (na x-ovej osi bude sekvencia x od teoreticky možného min(SKw) P° teoreticky možné max(S#vp) a na y-ovej osi teoretické kvantily y vypočítané pomocou funkcie qchisqO; qq-priamka bude prechádzať bodmi (2?o.25, £0.75) a (yo.25, ÍÍ0.75) alebo alternatívne bude qq-priamku reprezentovať os prvého a tretieho kvadrantu). DÚ Príklad 9 (koncentrácie; relatívne riziko, trend, odklon od trendu) Majme 3 rôzne koncentrácie látky (konci = 2.0, konc2 = 1.5 a konc^ = 0) a hľadáme jej účinok na pacientov, u ktorých sme sledovali objavenie sa nádoru. Zaujíma nás testovanie (a) Hq : \i(t) = X2 (t) = A3 (t) oproti Hi : 3 aspoň jedno i < j, Aj (t) = 9Xj (t) pomocou testovacích štatistík Qgb, Qcm, Qtw a Qppí (b) H0 : Ai (í) = A2 (í) = A3 (í) oproti Ax (í) = wl\3 (í), A2 (í) = (í), kde w* = koncj, j = 1,2 pomocou testovacej v statistiky Q trend- Otestujte ak odklon od trendu pomocou Qresid- (c) Vypočítajte relatívne riziko (í) 9p, Var[9p\ a 95%IS pre 9p, (2) 9mh a 95%IS pre 9mh a (3) 9*MH (ide o relatívne riziká konc\ : konc2 a konc\ : konc3). DÚ (22. decembra 2014)