5. Základní pojmy matematické statistiky 5.1. Motivace V teorii pravděpodobnosti je matematickým modelem náhodného pokusu pravděpodobnostní prostor . Výsledky náhodného pokusu jsou popsány pomocí náhodné veličiny . Pravděpodobnostní chování náhodné veličiny X je popsáno distribuční funkcí . Pravděpodobnostní prostor a distribuční funkci považujeme za známé a hledáme pravděpodobnosti jevů určené náhodnou veličinou X. V matematické statistice je situace odlišná. Máme číselné realizace n nezávislých pozorování náhodné veličiny X: x1 = X(ů1), ..., xn = X(ůn) a na jejich základě chceme učinit výpověď o distribuční funkci resp. o pravděpodobnostním prostoru . Předpokládáme, že X ~ , kde je známá třída distribučních funkcí (její znalost plyne z úvah o podstatě náhodného pokusu, jímž jsme data získali nebo z dřívějších zkušeností s podobnými daty), je skalární nebo vektorový parametr a je parametrický prostor, tj. množina všech přípustných hodnot parametru. Jedním z důležitých úkolů matematické statistiky je pomocí dat x1, ..., xn odhadnout (bodově či intervalově) parametr (nebo nějakou jeho parametrickou funkci )a tím specifikovat distribuční funkci , podle níž se řídí pravděpodobnostní chování náhodné veličiny X. Matematická statistika rovněž ověřuje pravdivost různých tvrzení o parametru či parametrické funkci . 5.2. Náhodný výběr a statistiky odvozené z náhodného výběru 5.2.1. Pojem náhodného výběru Nechť X1, ..., Xn jsou stochasticky nezávislé náhodné veličiny, které mají všechny stejné rozložení L(). Řekneme, že X1, ..., Xn je náhodný výběr rozsahu n z rozložení L(). (Číselné realizace x1, ..., xn náhodného výběru X1, ..., Xn uspořádané do sloupcového vektoru představují datový soubor.) Nechť (X1,Y1), ..., (Xn,Yn) jsou stochasticky nezávislé dvourozměrné náhodné vektory se stejným dvourozměrným rozložením L2(). Řekneme, že (X1,Y1), ..., (Xn,Yn) je dvourozměrný náhodný výběr rozsahu n z dvourozměrného rozložení L2(). (Číselné realizace (x1,y1), ..., (xn,yn) náhodného výběru (X1,Y1), ..., (Xn,Yn) uspořádané do matice typu n2 představují dvourozměrný datový soubor.) Analogicky lze definovat p-rozměrný náhodný výběr rozsahu n z p-rozměrného rozložení Lp(). 5.2.2. Pojem statistiky, příklady důležitých statistik Libovolná funkce T = T(X1, ..., Xn) náhodného výběru X1, ..., Xn (resp. p-rozměrného náhodného výběru) se nazývá statistika. a) Nechť X1, ..., Xn je náhodný výběr, n ? 2. Statistika M = se nazývá výběrový průměr, S2 = výběrový rozptyl, S = výběrová směrodatná odchylka. Pro libovolné, ale pevně zvolené reálné číslo x je statistikou též hodnota výběrové distribuční funkce . b) Nechť , ..., je p stochasticky nezávislých náhodných výběrů o rozsazích n1 ? 2, ..., np ? 2. Celkový rozsah je . Označme M1, ..., Mp výběrové průměry a S12, ..., Sp2 výběrové rozptyly jednotlivých výběrů. Statistika , kde c1, ..., cp jsou reálné konstanty, aspoň jedna nenulová, se nazývá lineární kombinace výběrových průměrů. Statistika se nazývá vážený průměr výběrových rozptylů. c) Nechť (X1,Y1), ..., (Xn,Yn) je náhodný výběr z dvourozměrného rozložení. Statistika S12 = je výběrová kovariance (přitom M1 =, M2 = ) a statistika R12 = se nazývá výběrový koeficient korelace. Pro libovolnou, ale pevně zvolenou dvojici reálných čísel x,y je statistikou též hodnota výběrové simultánní distribuční funkce . (Číselné realizace m, s2, s, s12, r12 statistik M, S2, S, S12, R12 odpovídají číselným charakteristikám znaků v popisné statistice, ale u rozptylu, směrodatné odchylky, kovariance a koeficientu korelace je multiplikativní konstanta , nikoli , jak tomu bylo v popisné statistice.) 5.3. Bodové a intervalové odhady parametrů a parametrických funkcí Vycházíme z náhodného výběru X1, ..., Xn z rozložení L(), které závisí na parametru . Množinu všech přípustných hodnot tohoto parametru označíme Î. Parametr neznáme a chceme ho odhadnout pomocí daného náhodného výběru (případně chceme odhadnout nějakou parametrickou funkci h()). Bodovým odhadem parametrické funkce h() je statistika Tn = T(X1, ..., Xn), která nabývá hodnot blízkých h(), ať je hodnota parametru jakákoliv. Existují různé metody, jak konstruovat bodové odhady (např. metoda momentů či metoda maximální věrohodnosti, ale těmi se zde zabývat nebudeme) a také různé typy bodových odhadů. Omezíme se na odhady nestranné, asymptoticky nestranné a konzistentní. Intervalovým odhadem parametrické funkce h() rozumíme interval (D, H), jehož meze jsou statistiky D = D(X1, ..., Xn), H = H(X1, ..., Xn) a který s dostatečně velkou pravděpodobností pokrývá h(), ať je hodnota parametru jakákoliv. 5.3.1. Typy bodových odhadů Nechť X1, ..., Xn je náhodný výběr z rozložení L(), h() je parametrická funkce, T, T1, T2, ... jsou statistiky. a) Řekneme, že statistika T je nestranným odhadem parametrické funkce h(), jestliže E(T) = h(). (Význam nestrannosti spočívá v tom, že odhad T nesmí parametrickou funkci h() systematicky nadhodnocovat ani podhodnocovat. Není-li tato podmínka splněna, jde o vychýlený odhad.) b) Jsou-li T1, T2 nestranné odhady téže parametrické funkce h(), pak řekneme, že T1 je lepší odhad než T2, jestliže D(T1) < D(T2). c) Posloupnost se nazývá posloupnost asymptoticky nestranných odhadů parametrické funkce h(), jestliže (Význam asymptotické nestrannosti spočívá v tom, že s rostoucím rozsahem výběru klesá vychýlení odhadu.) d) Posloupnost se nazývá posloupnost konzistentních odhadů parametrické funkce h(), jestliže (Význam konzistence spočívá v tom, že s rostoucím rozsahem výběru klesá pravděpodobnost, že odhad se bude realizovat "daleko" od parametrické funkce h().) Lze dokázat, že z nestrannosti odhadu vyplývá jeho asymptotická nestrannost a z asymptotické nestrannosti vyplývá konzistence, pokud posloupnost rozptylů odhadu konverguje k nule. 5.3.2. Vlastnosti důležitých statistik a) Nechť X1, ..., Xn je náhodný výběr z rozložení se střední hodnotou ě, rozptylem ó2 a distribuční funkcí Ö(x). Nechť n ? 2. Označme Mn výběrový průměr, Sn2 výběrový rozptyl a pro libovolné, ale pevně dané označme Fn(x) hodnotu výběrové distribuční funkce. Pak Mn je nestranným odhadem ě (tj. E(Mn) = ě) s rozptylem D(M) = , Sn2 je nestranným odhadem ó2 (tj. E(Sn2) = ó2), ať jsou hodnoty parametrů ě, ó2 jakékoli. Dále platí, že pro libovolné, ale pevně dané je výběrová distribuční funkce Fn(x) nestranným odhadem Ö(x) (tj. E(Fn(x)) = Ö(x)) s rozptylem D(Fn(x)) = Ö(x)(1- Ö(x))/n, ať je hodnota distribuční funkce Ö(x) jakákoliv. Posloupnost je posloupnost konzistentních odhadů ě, je posloupnost konzistentních odhadů ó2 a pro libovolné, ale pevně dané je posloupnost konzistentních odhadů Ö(x). b) Nechť , ..., je p stochasticky nezávislých náhodných výběrů o rozsazích n1 ? 2, ..., np ? 2 z rozložení se středními hodnotami ě1, ..., ěp a rozptylem ó2. Celkový rozsah je . Nechť c1, ..., cp jsou reálné konstanty, aspoň jedna nenulová. Pak lineární kombinace výběrových průměrů je nestranným odhadem lineární kombinace středních hodnot , ať jsou střední hodnoty ě1, ..., ěp jakékoli a vážený průměr výběrových rozptylů je nestranným odhadem rozptylu ó2, ať je rozptyl ó2 jakýkoliv. c) Nechť (X1,Y1), ..., (Xn,Yn) je náhodný výběr z dvourozměrného rozložení s kovariancí ó12 a koeficientem korelace ń. Pak výběrová kovariance S12 je nestranným odhadem kovariance ó12, ať je kovariance ó12 jakákoli, avšak E(R12) je rovno ń pouze přibližně (shoda je vyhovující pro n > 30), ať je korelační koeficient ń jakýkoli. 5.3.3. Pojem intervalu spolehlivosti Nechť X1, ..., Xn je náhodný výběr z rozložení L(), h() je parametrická funkce, á(0,1), D = D(X1, ..., Xn), H = H(X1, ..., Xn) jsou statistiky. a) Interval (D, H) se nazývá 100(1-á)% (oboustranný) interval spolehlivosti pro parametrickou funkci h(), jestliže:P(D < h() < H) ? 1-á. b) Interval (D, ?) se nazývá 100(1-á)% levostranný interval spolehlivosti pro parametrickou funkci h(ő), jestliže:P(D < h()) ? 1-á. c) Interval (-?, H) se nazývá 100(1-á)% pravostranný interval spolehlivosti pro parametrickou funkci h(), jestliže:P(h() < H) ? 1-á. Číslo á se nazývá riziko (zpravidla á = 0,05, méně často 0,1 či 0,01), číslo 1 -- á se nazývá spolehlivost. 5.3.4. Postup při konstrukci intervalu spolehlivosti a) Vyjdeme ze statistiky V, která je nestranným bodovým odhadem parametrické funkce h(). b) Najdeme tzv. pivotovou statistiku W, která vznikne transformací statistiky V, je monotónní funkcí h() a přitom její rozložení je známé a na h() nezávisí. Pomocí známého rozložení pivotové statistiky W najdeme kvantily wá/2, w1-á/2, takže platí: : P(wá/2 < W < w1-á/2) ? 1 -- á. c) Nerovnost wá/2 < W < w1-á/2 převedeme ekvivalentními úpravami na nerovnost D < h() < H. d) Statistiky D, H nahradíme jejich číselnými realizacemi d, h a získáme tak 100(1-á)% empirický interval spolehlivosti, o němž prohlásíme, že pokrývá h() s pravděpodobností aspoň 1 -- á. (Tvrzení, že (d,h) pokrývá h() s pravděpodobností aspoň 1 -- á je třeba chápat takto: jestliže mnohonásobně nezávisle získáme realizace x1, ..., xn náhodného výběru X1, ..., Xn z rozložení L() a pomocí každé této realizace sestrojíme 100(1-á)% empirický interval spolehlivosti pro h(), pak podíl počtu těch intervalů, které pokrývají h() k počtu všech sestrojených intervalů bude přibližně 1 -- á.) Příklad 1.: Nechť X1, ..., Xn je náhodný výběr z N(ě,ó2), kde n ? 2 a rozptyl ó2 známe. Sestrojte 100(1-á)% interval spolehlivosti pro neznámou střední hodnotu ě. Řešení: V tomto případě parametrická funkce h() = ě. Nestranným odhadem střední hodnoty je výběrový průměr (viz 5.3.(a)) M = . Protože M je lineární kombinací normálně rozložených náhodných veličin, bude mít také normální rozložení se střední hodnotou E(M) = ě a rozptylem D(M) = . Pivotovou statistikou W bude standardizovaná náhodná veličina ~ N(0,1). Kvantil wá/2 = uá/2 = -u1-á/2, w1-á/2 = u1-á/2. : 1 -- á ? P(-u1-á/2 < U < u1-á/2) = . Meze 100(1-á)% intervalu spolehlivosti pro střední hodnotu ě při známém rozptylu ó2 tedy jsou: D = , H = . Při konstrukci jednostranných intervalů spolehlivosti se riziko nepůlí, tedy 100(1-á)% levostranný interval spolehlivosti pro ě je a pravostranný je . Dosadíme-li do vzorců pro dolní a horní mez číselnou realizaci m výběrového průměru M, dostaneme 100(1-á)% empirický interval spolehlivosti. 5.3.5. Šířka intervalu spolehlivosti Nechť (d, h) je 100(1-á)% empirický interval spolehlivosti pro h() zkonstruovaný pomocí číselných realizací x1, ..., xn náhodného výběru X1, ..., Xn z rozložení L(). a) Při konstantním riziku klesá šířka h-d s rostoucím rozsahem náhodného výběru. b) Při konstantním rozsahu náhodného výběru klesá šířka h-d s rostoucím rizikem. Využití bodu (a) při stanovení minimálního rozsahu výběru y normálního rozložení: Nechť X1, ..., Xn je náhodný výběr z N(ě, s2), kde ó2 známe. Jaký musí být minimální rozsah výběru n, aby šířka 100(1-á)% empirického intervalu spolehlivosti pro střední hodnotu ě nepřesáhla číslo Ä? Řešení: Požadujeme, aby Ä ? h -- d = . Z této podmínky dostaneme, že . Za rozsah výběru zvolíme nejmenší přirozené číslo vyhovující této podmínce. Příklad 2.: Hloubka moře se měří přístrojem, jehož systematická chyba je nulová a náhodné chyby měření mají normální rozložení se směrodatnou odchylkou ó = 1 m. Kolik měření je nutno provést, aby se hloubka stanovila s chybou nejvýše +/- 0,25 m při spolehlivosti 0,95? Řešení: Hledáme rozsah výběru tak, aby šířka 95% intervalu spolehlivosti pro střední hodnotu ě nepřesáhla 0,5 m. Přitom ó známe. Z 5.3.5. vyplývá, že . Nejmenší počet měření je tedy 62. 5.4. Plánování pokusů Abychom mohli správně vyhodnotit výsledky pokusu, musí být pokus dobře naplánován. Předpokládejme například, že zkoumáme vliv výkrmné diety (resp. několika výkrmných diet) na hmotnostní přírůstky selat. Selatům podáváme výkrmnou dietu po dobu půl roku a poté zjistíme průměrné denní přírůstky. V závislosti na záměrech experimentátora rozeznáváme několik typů uspořádání pokusů. 5.4.1. Jednoduché pozorování Náhodná veličina je pozorována za týchž podmínek. Situace je charakterizována jedním náhodným výběrem X1, ..., Xn. (Náhodně vybereme n stejně starých selat téhož plemene, podrobíme je jediné výkrmné dietě a zjistíme hmotnostní přírůstky. Tak dostaneme realizaci jednoho náhodného výběru.) 5.4.2. Dvojné pozorování Zkoumá se rozdílnost hodnot náhodné veličiny pozorované za dvojích různých podmínek. Existují dvě odlišná uspořádání tohoto pokusu. a) Dvouvýběrové porovnávání: Situace je charakterizována dvěma nezávislými výběry a . (Z populace všech dostupných selat náhodně vybereme n1+n2 stejně starých selat téhož plemene. Náhodně je rozdělíme na dva soubory o rozsazích n1 a n2, první podrobíme výkrmné dietě č. 1 a druhý výkrmné dietě č. 2. Tak dostaneme realizace dvou nezávislých náhodných výběrů.) b) Párové porovnávání: Situace je charakterizována jedním náhodným výběrem (X11,X12), ..., (Xn1,Xn2) z dvourozměrného rozložení. Párem se rozumí dvojice (Xi1,Xi2), i = 1, ..., n . Úloha se zpravidla převádí na jednoduché pozorování náhodného výběru rozdílů Xi1 -- Xi2, kde i = 1, ..., n. (Náhodně vybereme n vrhů selat a z nich vždy dva sourozence a náhodně jim přiřadíme 1. a 2. výkrmnou dietu. Tak dostaneme realizaci náhodného výběru z dvourozměrného rozložení.) 5.4.3. Mnohonásobné pozorování Zkoumá se rozdílnost hodnot náhodné veličiny pozorované za r ? 3 různých podmínek. Existují dvě odlišná uspořádání tohoto pokusu. a) Mnohovýběrové porovnávání: Situace je charakterizována r nezávislými náhodnými výběry , ..., . (Z populace všech dostupných selat náhodně vybereme n1+n2+...+nr stejně starých selat téhož plemene. Náhodně je rozdělíme na r souborů o rozsazích n1, n2, ..., nr. Selata z prvního souboru podrobíme výkrmné dietě č. 1, ..., selata z r-tého souboru podrobíme výkrmné dietě č. r. Tak dostaneme realizace r nezávislých náhodných výběrů.) b) Blokové porovnávání: Situace je charakterizována jedním náhodným výběrem (X11,X12, ..., X1r), ..., (Xn1,Xn2, ..., Xnr) z r-rozměrného rozložení. Blokem se rozumí r-tice (Xi1,Xi2, ..., Xir), i = 1, ..., n. (Náhodně vybereme n vrhů selat a z nich vždy r sourozenců a náhodně jim přiřadíme 1. až r-tou výkrmnou dietu. Tak dostaneme realizaci náhodného výběru z r-rozměrného rozložení.) 5.5. Úvod do testování hypotéz Testování hypotéz je důležitou úlohou statistické indukce. Pomocí statistické indukce se snažíme na základě znalosti náhodného výběru usuzovat na vlastnosti rozložení, z něhož tento výběr pochází. Nulovou hypotézou rozumíme nějaké tvrzení o parametrech nebo typu rozložení, z něhož pochází náhodný výběr. Nulová hypotéza vyjadřuje nějaký teoretický předpoklad, často skeptického rázu a uživatel ji musí stanovit předem, bez přihlédnutí k datovému souboru. Proti nulové hypotéze stavíme alternativní hypotézu, která říká, co platí, když neplatí nulová hypotéza. Např. nulová hypotéza tvrdí, že střední hodnota hmotnosti balíčků cukru balených na automatické lince se nezměnila seřízením automatu, zatímco alternativní hypotéza tvrdí opak. Postup, který je založen na daném náhodném výběru a s jehož pomocí rozhodneme o zamítnutí či nezamítnutí nulové hypotézy, se nazývá testování hypotéz. Rozlišujeme testy parametrické a neparametrické. Parametrické testy předpokládají, že daný náhodný výběr pochází z určitého typu rozložení (často normálního), které závisí na nějakých neznámých parametrech. Naproti tomu neparametrické testy nevyžadují předpoklad o určitém typu rozložení, ale stačí jim splnění jen velmi obecných podmínek, např. že distribuční funkce je spojitá. 5.5.1. Nulová a alternativní hypotéza Nechť X1, ..., Xn je náhodný výběr z rozložení L(), kde parametr neznáme. Nechť h() je parametrická funkce a c daná reálná konstanta. a) Oboustranná alternativa: Tvrzení H0: h() = c se nazývá jednoduchá nulová hypotéza. Proti nulové hypotéze postavíme složenou alternativní hypotézu H1: h() c. b) Levostranná alternativa: Tvrzení H0: h() ? c se nazývá složená pravostranná nulová hypotéza. Proti jednoduché nebo složené pravostranné nulové hypotéze postavíme složenou levostrannou alternativní hypotézu H1: h() < c. c) Pravostranná alternativa: Tvrzení H0: h() ? c se nazývá složená levostranná nulová hypotéza. Proti jednoduché nebo složené levostranné nulové hypotéze postavíme složenou pravostrannou alternativní hypotézu H1: h() > c. Testováním H0 proti H1 rozumíme rozhodovací postup založený na náhodném výběru X1, ..., Xn, s jehož pomocí zamítneme či nezamítneme platnost nulové hypotézy. Volba alternativní hypotézy není libovolná, ale vyplývá z konkrétní situace. Např. při současné technologii je pravděpodobnost vyrobení zmetku = 0,01. a) Po rekonstrukci výrobní linky byla obnovena výroba, přičemž technologie zůstala stejná. Chceme ověřit, zda se změnila kvalita výrobků. Testujeme H0: = 0,01 proti H1: 0,01. b) Byly provedeny změny v technologii výroby s cílem zvýšit kvalitu. V tomto případě tedy testujeme H0: = 0,01 proti H1: < 0,01. c) Byly provedeny změny v technologii výroby s cílem snížit náklady. V této situaci testujeme H0: = 0,01 proti H1: > 0,01. 5.5.2. Chyba 1. a 2. druhu Při testování H0 proti H1 se můžeme dopustit jedné ze dvou chyb: chyba 1. druhu spočívá v tom, že H0 zamítneme, ač ve skutečnosti platí a chyba 2. druhu spočívá v tom, že H0 nezamítneme, ač ve skutečnosti neplatí. Situaci přehledně znázorňuje tabulka: skutečnost rozhodnutí H0 nezamítáme H0 zamítáme H0 platí správné chyba 1. rozhodnutí druhu H0 neplatí chyba 2. správné druhu rozhodnutí Pravděpodobnost chyby 1. druhu se značí á a nazývá se hladina významnosti testu (většinou bývá á = 0,05, méně často 0,1 či 0,01). Pravděpodobnost chyby 2. druhu se značí â. Číslo 1--â se nazývá síla testu a vyjadřuje pravděpodobnost, s jakou test vypoví, že H0 neplatí. 5.5.3. Testování pomocí kritického oboru Najdeme statistiku T0 = T0(X1, ..., Xn), kterou nazveme testovým kritériem. Množina všech hodnot, jichž může testové kritérium nabýt, se rozpadá na obor nezamítnutí nulové hypotézy (značí se V) a obor zamítnutí nulové hypotézy (značí se W a nazývá se též kritický obor). Tyto dva obory jsou odděleny kritickými hodnotami (pro danou hladinu významnosti á je lze najít ve statistických tabulkách). Jestliže číselná realizace t0 testového kritéria T0 padne do kritického oboru W, pak nulovou hypotézu zamítáme na hladině významnosti á a znamená to skutečné vyvrácení testované hypotézy. Jestliže t0 padne do oboru nezamítnutí V, pak jde o pouhé mlčení, které platnost nulové hypotézy jenom připouští. Pravděpodobnosti chyb 1. a 2. druhu nyní zapíšeme takto: P(T0 W/H0 platí) = á, P(T0 V /H1 platí) = â. Stanovení kritického oboru pro danou hladinu významnosti á: Označme tmin (resp. tmax) nejmenší (resp. největší) hodnotu testového kritéria. Kritický obor v případě oboustranné alternativy má tvar W = , kde Ká/2(T) a K1-á/2(T) jsou kvantily rozložení, jímž se řídí testové kritérium T0, je-li nulová hypotéza pravdivá. Kritický obor v případě levostranné alternativy má tvar: W = . Kritický obor v případě pravostranné alternativy má tvar: W = . Doporučuje se dodržovat následující postup: - Stanovíme nulovou hypotézu a alternativní hypotézu. Přitom je vhodné zvolit jako alternativní hypotézu ten předpoklad, jehož přijetí znamená závažné opatření a mělo by k němu dojít jen s malým rizikem omylu. - Zvolíme hladinu významnosti á. Zpravidla volíme á = 0,05, méně často 0,1 nebo 0,01. - Najdeme vhodné testové kritérium a na základě zjištěných dat vypočítáme jeho realizaci. - Stanovíme kritický obor. - Jestliže realizace testového kritéria padla do kritického oboru, nulovou hypotézu zamítáme na hladině významnosti á. V opačném případě nulovou hypotézu nezamítáme na hladině významnosti á. 5.5.4. Testování pomocí intervalu spolehlivosti Sestrojíme 100(1-á)% empirický interval spolehlivosti pro parametrickou funkci h(). Pokryje-li tento interval hodnotu c, pak H0 nezamítáme na hladině významnosti á, v opačném případě H0 zamítáme na hladině významnosti á. Pro test H0 proti oboustranné alternativě sestrojíme oboustranný interval spolehlivosti. Pro test H0 proti levostranné alternativě sestrojíme pravostranný interval spolehlivosti. Pro test H0 proti pravostranné alternativě sestrojíme levostranný interval spolehlivosti. 5.5.5. Testování pomocí p-hodnoty p-hodnota udává nejnižší možnou hladinu významnosti pro zamítnutí nulové hypotézy. Je-li p-hodnota ? á, pak H0 zamítáme na hladině významnosti á, je-li p-hodnota > á, pak H0 nezamítáme na hladině významnosti á. Způsob výpočtu p-hodnoty: Pro oboustrannou alternativu p = 2 min{P(T0 ? t0), P(T0 ? t0)}. Pro levostrannou alternativu p = P(T0 ? t0). Pro pravostrannou alternativu p = P(T0 ? t0). p-hodnota vyjadřuje pravděpodobnost, s jakou číselné realizace x1, ..., xn náhodného výběru X1, ..., Xn podporují H0, je-li pravdivá. Statistické programové systémy poskytují ve svých výstupech p-hodnotu. Její výpočet vyžaduje znalost distribuční funkce rozložení, kterým se řídí testové kritérium T0, je-li H0 pravdivá. Vzhledem k tomu, že v běžných statistických tabulkách jsou uvedeny pouze hodnoty distribuční funkce standardizovaného normálního rozložení, bez použití speciálního software jsme schopni vypočítat p-hodnotu pouze pro test hypotézy o střední hodnotě normálního rozložení při známém rozptylu. 5.5.6. Příklad 10 x nezávisle na sobě byla změřena jistá konstanta ě. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru X1, ..., X10 z rozložení N(ě, 0,04). Nějaká teorie tvrdí, že ě = 1,95. a) Oboustranná alternativa Proti nulové hypotéze H0: ě = 1,95 postavíme oboustrannou alternativu H1: ě 1,95. Na hladině významnosti 0,05 testujte H0 proti H1 všemi třemi popsanými způsoby. Řešení: m = = 2,06, ó2 = 0,04, n = 10, á = 0,05, c = 1,95 a) Test provedeme pomocí kritického oboru. Pro úlohy o střední hodnotě normálního rozložení při známém rozptylu používáme pivotovou statistiku U = ~ N(0, 1) (viz 5.3.4.). Testové kritérium tedy bude T0 = a bude mít rozložení N(0, 1), pokud je nulová hypotéza pravdivá. Vypočítáme realizaci testového kritéria: t0 = =1,74. Stanovíme kritický obor: W = = = = = . Protože 1,74 W, H0 nezamítáme na hladině významnosti 0,05. b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(1-á)% empirického intervalu spolehlivosti pro střední hodnotu ě při známém rozptylu ó2 jsou (viz 5.3.4.): (d, h) = (m - u1-á/2, m + u1-á/2). V našem případě dostáváme: d = 2,06 - u0,975 = 2,06 - .1,96 = 1,936, h = 2,184. Protože 1,95 (1,936; 2,184), H0 nezamítáme na hladině významnosti 0,05. c) Test provedeme pomocí p-hodnoty. Protože proti nulové hypotéze stavíme oboustrannou alternativu, použijeme vzorec p = 2 min{P(T0 ? t0), P(T0 ? t0)} = 2 min {P(T0 ? 1,74), P(T0 ? 1,74)} = = 2 min { Ö(1,74), 1 -- Ö(1,74) } = 2 min { 0,95907, 1 -- 0,95907 } = 0,08186. Jelikož 0,08186 > 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05. b) Levostranná alternativa Proti nulové hypotéze H0: ě = 1,95 postavíme levostrannou alternativu H1: ě < 1,95. Na hladině významnosti 0,05 testujte H0 proti H1 všemi třemi popsanými způsoby. Řešení: a) Test provedeme pomocí kritického oboru. Na rozdíl od oboustranné alternativy bude mít kritický obor tvar W = . Protože 1,74 W, H0 nezamítáme na hladině významnosti 0,05. b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(1-á)% empirického pravostranného intervalu spolehlivosti pro střední hodnotu ě při známém rozptylu ó2 jsou (viz 5.3.4.): (-?, h) = (-?, m + u1-á). V našem případě dostáváme: h = 2,06 + u0,95 = 2,06 + .1,645 = 2,164. Protože 1,95 (-?; 2,164), H0 nezamítáme na hladině významnosti 0,05. c) Test provedeme pomocí p-hodnoty. Protože proti nulové hypotéze stavíme levostrannou alternativu, použijeme vzorec p = P(T0 ? t0) = Ö(1,74) = 0,95907. Jelikož 0,95907 > 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05. c) Pravostranná alternativa Proti nulové hypotéze H0: ě = 1,95 postavíme pravostrannou alternativu H1: ě > 1,95. Na hladině významnosti 0,05 testujte H0 proti H1 všemi třemi popsanými způsoby. Řešení: a) Test provedeme pomocí kritického oboru. Na rozdíl od oboustranné alternativy bude mít kritický obor tvar W = . Protože 1,74 W, H0 zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternativy. b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(1-á)% empirického levostranného intervalu spolehlivosti pro střední hodnotu ě při známém rozptylu ó2 jsou (viz 5.3.4.): (d, ?) = (m - u1-á, ?). V našem případě dostáváme: d = 2,06 - u0,95 = 2,06 - .1,645 = 1,956. Protože 1,95 (1,956, ?), H0 zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternativy. c) Test provedeme pomocí p-hodnoty. Protože proti nulové hypotéze stavíme pravostrannou alternativu, použijeme vzorec p = P(T0 ? t0) = 1 - Ö(1,74) = 1 - 0,95907 = 0,04093. Jelikož 0,04093 ? 0,05, nulovou hypotézu zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternativy. Příklady k 5. kapitole Příklad 1. : Nechť X1, ..., Xn je náhodný výběr z rozložení se střední hodnotou ě, rozptylem ó2 a distribuční funkcí Ö(x). Nechť n ? 2. a) Vypočtěte střední hodnotu a rozptyl výběrového průměru M = . b) Vypočtěte střední hodnotu výběrového rozptylu S2 = c) Pro libovolné, ale pevně zvolené reálné x vypočtěte střední hodnotu a rozptyl výběrové distribuční funkce . Řešení: ad a) E(M) = , D(M) = . ad b) (Pro informaci, bez důkazu: , kde ă4 je 4. centrální moment. ad c) Pro libovolné, ale pevně zvolené reálné číslo x zavedeme transformovanou náhodnou veličinu Yn, která udává počet těch náhodných veličin X1, ..., Xn, které nabývají hodnoty menší nebo rovné x, tedy Fn(x) = Yn/n. Odvodíme rozložení náhodné veličiny Yn. Je to diskrétní náhodná veličina. Její pravděpodobnostní funkce đ(y) = P(Yn = y). Má-li veličina Yn nabýt hodnoty y, musí právě y veličin z n veličin X1, ..., Xn nabýt hodnoty menší nebo rovné x. Přitom P(Xi ? x) = Ö(x). Odtud tedy plyne, že Yn ~ Bi(n, Ö(x)). Je nám známo, že E(Yn) = = n Ö(x) a D(Yn) = n Ö(x)(1- Ö(x)). Využitím vlastností střední hodnoty a rozptylu snadno odvodíme, že E(Fn(x)) = Ö(x) a D(Fn(x)) = Ö(x)(1- Ö(x))/n. Příklad 2. : Nechť (X1,Y1), ..., (Xn,Yn) je náhodný výběr z dvourozměrného rozložení s vektorem středních hodnot (ě1, ě2) a kovariancí ó12. Vypočtěte střední hodnotu výběrové kovariance S12 = . Řešení: (Kovariance C(Xi, Yj) = 0 pro i ? j, protože se jedná o náhodný výběr.) Příklad 3: Nechť a jsou stochasticky nezávislé náhodné výběry, první z rozložení se střední hodnotou ě1 a rozptylem ó2, druhý z rozložení se střední hodnotou ě2 a rozptylem ó2. Označme M1, M2 výběrové průměry, S12, S22 výběrové rozptyly a vážený průměr výběrových rozptylů a) Dokažte, že statistika M1 - M2 je nestranným odhadem parametrické funkce ě1 - ě2. b) Dokažte, že S*2 je nestranným odhadem ó2. Řešení: ad a) E(M1 - M2) = E(M1) -- E(M2) = ě1 - ě2. ad b) Příklad 4: Nezávisle opakovaná laboratorní měření určité konstanty jsou charakterizována náhodným výběrem X1, ..., Xn, E(Xi) = ě, D(Xi) = ó2, i = 1, ..., n. Uvažme statistiky . a) Dokažte, že Mn a Ln jsou nestranné odhady konstanty ě a zjistěte, který z nich je lepší. b) Dokažte, že tvoří posloupnosti asymptoticky nestranných odhadů konstanty ě. c) Zjistěte, zda tvoří posloupnosti konzistentních odhadů konstanty ě. Řešení: ad a) E(Mn) = ě -- viz příklad 1, bod (a). D(Mn) = -- viz příklad 1, bod (a). . Pro n ? 3 je tedy lepším odhadem konstanty ě výběrový průměr Mn. ad b) Asymptotická nestrannost plyne z nestrannosti. ad c) Posloupnost asymptoticky nestranných odhadů je posloupností konzistentních odhadů, pokud posloupnost rozptylů konverguje k nule. , tedy posloupnost výběrových rozptylů je posloupností konzistentních odhadů konstanty ě. , tedy posloupnost není posloupností konzistentních odhadů konstanty ě. Práce se systémem STATISTICA Téma: Ilustrace základních pojmů matematické statistiky a) Průzkum chování výběrového průměru a výběrového rozptylu Nechť X1, ..., Xn je náhodný výběr z rozložení se střední hodnotou ě a rozptylem ó2. Pak pro výběrový průměr M = a výběrový rozptyl S2 = platí: E(M) = ě, D(M) = ó2/n, E(S2) = ó2. Tyto vlastnosti budeme ilustrovat na náhodném výběru rozsahu 100 z rozložení Rs(0,1). V tomto případě E(Xi) = 1/2, D(Xi) = 1/12. 1. Vytvořte nový datový soubor o 103 proměnných a 100 případech. Pomocí programu gener.svb, který si stáhnete z webové stránky, se naplní prvních 100 proměnných 100 realizacemi náhodných veličin Xi ~ Rs(0,1), i=1, ..., 100, do proměnné v101 se uloží pořadová čísla 1 až 100, do proměnné v102 (resp. v103) se uloží průměry (resp. rozptyly) proměnných v1 až v100. Proměnnou v101 přejmenujte na PORADI, v102 na PRUMER a v103 na ROZPTYL. Vzniklý datový soubor uložte pod názvem uniform.sta. 2. Graficky znázorněte hodnoty některé z proměnných v1, ..., v100 (např. v1) a hodnoty proměnné PRUMER. Návod: Graphs -- Scatterplots -- Graph type Multiple -- vypneme Linear fit -- Variables X PORADI, Y v1, PRUMER, OK, OK.Vidíme, že hodnoty proměnné v1 se nacházejí mezi 0 a 1, zatímco hodnoty proměnné PRUMER se koncentrují v úzkém pásu kolem 0,5. 3. Pomocí Descriptive Statistics vypočtěte průměr a rozptyl např. proměnné v1 a proměnné PRUMER. Průměr proměnné v1 by měl být blízký 0,5, rozptyl 1/12 = 0,083. Průměr proměnné PRUMER by se měl blížit 0,5, zatímco rozptyl by měl být 100 x menší než 1/12, tj. 0,00083. Dále vypočtěte průměr proměnné ROZPTYL. Měl by se blížit 1/12 = 0,083. b) Ověření nestrannosti výběrové distribuční funkce Nechť X1, ..., Xn je náhodný výběr z rozložení s distribuční funkcí Ö(x). Pro libovolné, ale pevně zvolené reálné číslo x označme hodnotu výběrové distribuční funkce v bodě x. Pak E(Fn(x)) = Ö(x), tj. pro libovolné. Ale pevně zvolené reálné x je výběrová distribuční funkce nestranným odhadem distribuční funkce Ö(x). Tuto vlastnost budeme ilustrovat na náhodném výběru rozsahu 1000 z rozložení N(0,1). 1. Vytvořte nový datový soubor o dvou proměnných a 1000 případech. 2. Do proměnné v1 uložte 1000 realizací náhodné veličiny s rozložením N(0,1) tak, že v Long Name použijte příkaz =vnormal(rnd(1);0;1). 3. Hodnoty proměnné v1 setřiďte podle velikosti: Data - Sort. 4. Proměnnou v2 transformujte tak, že v Long Name použijte příkaz =v0/1000. Nakreslete dvourozměrný tečkový diagram, kde na osu x vyneste v1 a na osu y v2. Graf této výběrové distribuční funkce porovnejte s grafem distribuční funkce N(0,1) na intervalu -3 až 3. Ten získáte tak, že k datovému souboru přidáte proměnnou x a proměnnou y. Do Long Name proměnné x napište příkaz =6*(v0-1)/1000-3 a do Long Name proměnné y napište příkaz =INormal(x;0;1). Pomocí Scatterplot vykreslíte graf distribuční funkce rozložení N(0,1). c) Šířka intervalu spolehlivosti v závislosti na rozsahu výběru a v závislosti na riziku Nechť (d, h) je 100(1-á)% empirický interval spolehlivosti pro h() zkonstruovaný pomocí číselných realizací x1, ..., xn náhodného výběru X1, ..., Xn z rozložení L(). - Při konstantním riziku klesá šířka h-d s rostoucím rozsahem náhodného výběru. - Při konstantním rozsahu náhodného výběru klesá šířka h-d s rostoucím rizikem. Tyto vlastnosti budeme ilustrovat na intervalu spolehlivosti sestrojeném pro střední hodnotu ě rozložení N(0,1). Sledování vlivu rozsahu výběru na šířku intervalu spolehlivosti (při á=0,05) Pro hypotetické náhodné výběry rozsahu n (n = 5, 7, 9, ..., 85) z rozložení N(0,1), jejichž výběrové průměry se vždy realizovaly hodnotou 0, vypočtěte dolní a horní meze 95% intervalů spolehlivosti pro ě a graficky znázorněte závislost těchto mezí na rozsahu n. Návod: Program intsp1.svb otevřete v programovacím okně. Vytvořte nový datový soubor o 3 proměnných a 41 případech. Po spuštění programu intsp1 se do proměnné v1 uloží rozsahy výběrů 5, 7, ..., 85, do v2 (resp. v3) dolní (resp. horní) meze 95% intervalů spolehlivosti pro ě. Vytvoření grafu: Graphs -- Scatterplots -- Graph type Multiple -- vypnout Linear fit -- Variables X v1, Y v2, v3, OK, OK. Sledování vlivu rizika na šířku intervalu spolehlivosti (při konstatním rozsahu výběru) Pro hypotetický náhodný výběr rozsahu n=25 z rozložení N(0,1), jehož výběrový průměr se realizoval hodnotou 0, vypočtěte dolní a horní meze 100(1-á)% intervalů spolehlivosti (á=0,20, 0,19, ..., 0,01) pro ě a graficky znázorněte závislost těchto mezí na riziku á. Návod: Program intsp2.svb otevřete v programovacím okně. Vytvořte nový datový soubor o 3 proměnných a 20 případech. Po spuštění programu intsp2 se do proměnné v1 uloží rizika 0,20, 0,19, ..., 0,01, do v2 (resp. v3) dolní (resp. horní) meze 100(1-á)% intervalů spolehlivosti pro ě.Vytvoření grafu: stejným způsobem jako v předešlém případě.