Asymptotické vlastnosti odhadov Konvergencie Štatistická inferencia Asymptotické vlastnosti odhadov Stanislav Katina1 1 Ústav matematiky a štatistiky, Masarykova univezita Honoráry Research Fellow, The University of Glasgow 11. decembra 2018 Štatistická inferencia o 9* sa vykonáva na základe odhadu 9 — 9n. Podobne štatistická inferencia o g{9*) sa vykonáva na základe odhadu g(6n). Bodový odhad parametrickej funkcie g(9) je štatistika Tn — T(Xi ,X2,..., Xn) nadobúdajúca hodnoty blízko g(9). Nech Tn — g(9n) je nejaký odhad g{6), podobne Tn — 9n je nejaký odhad 9. Potom môžeme definovaf nasledovné typy konvergencií pre Tn (čo platí aj pre g(9) — 9): Stanislav Katina Štatistická interencia Stanislav Katina Statistická interencia Asymptotické vlastnosti odhadov Konvergencie Asymptotické vlastnosti odhadov Vlastnosti odhadov Q konvergencia skoro všade Pr f lim T„ = g (9)) = 1, pre V(9eQ, O konvergencia v kvadratickom strede T n 0, preVöeG, 3/12 ' g(9)^E6[(Tn-g(9)rj O konvergencia pod f a pravdepodobnosti (ozn. ^) lim (Pr(|rn-flf(ö)| > e)) = 0, pre e > 0, pre Vf5eG, n^oo O konvergencia v distribúcii (ozn. ~) lim F„{x) = Fx(x) n^oo vo všetkých bodoch x, kde Fn(x) je empirická distribučná funkcia a Fx (x) je spojitá distribučná funkcia. Stanislav Katina Štatistická interencia Nech Xi, X2,..., Xn je náhodný výber z rozdelenia F*, g(9) je parametrická funkcia a Tn, Ti a T2 sú štatistiky, E[Tn\ je stredná hodnota a VarfT,,] rozptyl štatistiky Tn. 9 hovoríme, že štatistika Tn je nevychýlený odhad parametrickej funkcie g(9), ak E[Tn\ — g(9),V9 e G, t.j. odhad Tn nesmie paramatrickú funkciu systematicky nadhodnocovat alebo podhodnocovat- ak táto podmienka nie je splnená, hovoríme o vychýlenom odhade, o ak 7~i, T2 sú dva nevychýlené odhady tej istej parametrickej funkcie g(9), potom 7i je lepší odhad g(9) ako T2, ak \Zar[Ti] < Var[T2],V9 e Q, t.j. ak existuje odhad s menším rozptylom, je potrebné ho v štatistickej inferencii použií namiesto odhadu s väčším rozptylom (to môžeme docielif optimalizáciou dizajnu experimentu vhodnou volbou bodov, v ktorých budeme meraf), Stanislav Katina Štatistická interencia Asymptotické vlastnosti odhadov Vlastnosti odhadov Asymptotické vlastnosti odhadov Vlastnosti odhadov Tn sa nazýva asymptoticky nevychýlený odhad g{9), ak platí lirtin^oo E[Tn\ — g{6), t.j. s rastúcim rozsahom náhodného výberu n, klesá výchylka odhadu (to môžeme docielií optimalizáciou dizajnu experimentu vhodnou voľbou n), Tn sa nazýva konzistentný odhad g{6), ak platí limn^oo Pr(| Tn - g{6)\ > e) — 0, t.j. s rastúcim rozsahom náhodného výberu n klesá pravděpodobnost, že odhad sa bude realizovaí ďaleko od g(8) (to môžeme docielií optimalizáciou dizajnu experimentu vhodnou volbou n), o Tn sa nazýva konzistentný a asymptoticky efektívny (eficientný, výdatný) odhad g(6), ak platí (Tn - g(6)) ~ A/(0, C(g(6))), kde V znamená v distribúcii, C(g(9)) je Raova-Cramerova spodná hranica definovaná ako C(g(e)) = - ?'(e)]2 Ee[^ln/.(0|x)] ni(6) kde i(8) je Fisherova miera informácie jedného pozorovania, L(6\x) je funkcia vierohodnosti (táto vlastnosf sa používa pri testovaní hypotéz ako predpoklad asymptotického rozdelenia testovacej štatistiky za predpokladu normality rozdelenia X), 9 Tn sa nazýva asymptoticky normálny odhad g(8), ak platí J"g(g|g^ ~ ^(0' 1) vlastnosf sa tiež používa pri testovaní hypotéz ako predpoklad asymptotického rozdelenia testovacej štatistiky za predpokladu normality rozdelenia X). 5/12 Stanislav Katina Štatistická inferencia Asymptotické vlastnosti odhadov Vlastnosti odhadov Stanislav Katina Statistická interencia Z nevychýlenosti odhadu vyplýva jeho asymptotická nevychýlenosf a z asymptotickej nevychýlenosti vyplýva konzistencia, ak limn^oo Var[Tn] — 0. Implikáciou posleného bodu je T v N(a<8) [9'{9)]2 \ kde ni(g(8)) = l(g(8)). Ak g{8) = 8, potom kde n i (6) —1(8). Ak k > 1, potom je 6 vektor a môžeme písaf (g(Ôn) - g(oj) Z Nk (o, ar(/(0))-1 a) , kde A = ^flf(ö). Ak gf(0) = 0, potom (e„ -e)~Nk (o, (/(e)) Asymptotické vlastnosti odhadov Vlastnosti odhadov - normálne rozdelenie Nech náhodná premenná X pochádza z normálneho rozdelenia s parametrami [i a a2, X — A/(/z, c2), kde E [X] = /z je stredná hodnota a Var[X] = a2 je rozptyl náhodnej premennej X. Potom výberový aritmetický priemer Xn — X je nevychýleným odhadom /i a výberový rozptyl S2_^ — S2 je nevychýleným odhadom a2 (n - 1 v dolnom indexe S^_1 znamená počet stupňov voľnosti). Zároveň platí, že X a S2 sú asymptoticky nevychýlené, konzistentné, asymptoticky efektívne a asymptoticky normálne. Preto môžeme písaf nasledovné Vn(Xn - /x) ~ A/(0, cr2), čo je ekvivalentné Xn ~ N (/i, Vň(S2 - a2) ~ A/(0,kde S2 n- 1 30. Realizáciou X je x a realizáciou S2 je s2. Nech dvojrozmerná náhodná premenná (Xi, X2)T pochádza z dvojrozmerného normálneho rozdelenia s parametrami /x a Z, (X1,X2)7"^ A/2(/x,Z),kde/x = (Ml,M2)7", Z= af ci2 — 30. Avšak E[f?i2] sa rovná p len približne (zhoda nastane až pre n > 30). Naviac píšeme, že f?i2 je nevychýleným odhadom p. Zároveň platí, že f?i2 je asymptoticky nevychýlený a konzistentný. Realizáciou S12 je s-\2 a realizáciou f?i2 je r. Nech náhodná premenná X pochádza z normálneho rozdelenia s parametrami p a a2, X — A/(/z, a2), kde E[X] — p je stredná hodnota a Var[X] = a2 je rozptyl náhodnej premennej X. Nech g{6) — a j p, kde B = (M, a2)^, flf(0„) = J a A = ^0(0) = T. Potom ^(|-?)£^(°'A^)rlA)' kde Ar(/(0))_1 A = ^) (<£ 2ir)7' = ^(^+i). 11/12 Stanislav Katina Štatistická interencia 12/12 Stanislav Katina Štatistická interencia