Základní pojmy matematické statistiky
Motivace:
Matematická statistika je věda, která analyzuje a interpretuje data především za účelem získání předpovědi a zlepšení rozhodování v různých oborech lidské činnosti. Přitom se řídí principem statistické indukce, tj. na základě znalostí o náhodném výběru z určitého rozložení pravděpodobností se snaží učinit závěry o vlastnostech tohoto rozložení. Ústředním pojmem matematické statistiky je tedy pojem náhodného výběru.
Definice náhodného výběru:
a) Nechť Xi,    Xn jsou stochasticky nezávislé náhodné veličiny, které mají všechny stejné rozložení L(ů). Řekneme, že X1?    Xn je náhodný výběr rozsahu n z rozložení L(ů). (Číselné realizace x1?    xn náhodného výběru X1?Xn uspořádané do sloupcového vektoru odpovídají datovému souboru zavedenému v popisné statistice.)
b) Nechť (Xi,Yi),(Xn,Yn) jsou stochasticky nezávislé dvourozměrné náhodné vektory, které mají všechny stejné dvourozměrné rozložení L^iů). Řekneme, že (X^Y^,    (Xn,Yn) je dvourozměrný náhodný výběr rozsahu n
z dvourozměrného rozložení L2(ů). (Číselné realizace (xi,yi),    (xn,yn) náhodného výběru (Xi,Yi), (Xn,Yn) uspořádané do matice typu nx2 odpovídají dvourozměrnému datovému souboru zavedenému v popisné statistice.)
c) Analogicky lze definovat p-rozměrný náhodný výběr rozsahu n z p-rozměrného rozložení Lp($).
Definice statistiky:
Libovolná funkce T = T(X1?    Xn) náhodného výběru X1?    Xn (resp. T = T(XuYi,    Xn,Yn) náhodného výběru (X^Y^, (Xn,Yn)) se nazývá (výběrová) statistika.
Definice důležitých statistik:
a) Nechť Xl9Xn je náhodný výběr, n > 2.
1   11 2 1     n I-
Označme M = -VXj ... výběrový průměr, S =-V (x; -m)2 ... výběrový rozptyl, S = vS2 ... výběrová směrodatná
odchylka
Pro libovolné, ale pevně dané reálné číslo x je statistikou též hodnota výběrové distribuční funkce Fn(x) = — cardfcx, < x}
n
b) Nechť je dáno r > 2 stochasticky nezávislých náhodných výběrů o rozsazích ni > 2, ..., nr > 2.
r
Celkový rozsah je n = ^ .
j=i
2 2 ?
Označme Mi, ..., Mr výběrové průměry a Si , ..., Sr výběrové rozptyly jednotlivých výběrů. Nechť Ci, ..., cr jsou reálné konstanty, aspoň jedna nenulová.
2-iCj^j • • • lineární kombinace výběrových průměrů, S«2 = —-... vážený průměr výběrových rozptylů.
j=i n"r
c) Nechť (Xi,Yi),    (Xn,Yn) je náhodný výběr z dvourozměrného rozložení o rozsahu n.
Označme m, =— V x;, m2 =-Vyí výběrové průměry,     =-X(Xi ~Mi)2' S22 =-T!(Yi ~M2)2 výběrové rozptyly.
nt~i n-l~r n-l~^
^1^2 ... výběrový koeficient korelace.
0 jinak
Pro libovolnou, ale pevně zvolenou dvojici reálných čísel x,y je statistikou též hodnota výběrové simultánní distribuční funkce Fn (x, y) = — cardfoXj <xaYj < y}.
1 11
Si2 =-V (X; - M, )(y; - M2)... výběrová kovariance, Ri2 = '
Upozornění: Číselné realizace statistik M, S2, S, Si2, R12 odpovídají číselným charakteristikám m, s2, s, Si2, rí2 zavedeným v popisné statistice, ale u rozptylu, směrodatné odchylky, kovariance a koeficientu korelace je multiplikativní konstanta
—í—, nikoliv —, jak tomu bylo v popisné statistice. Jak uvidíme později, uvedené číselné realizace mohou být považovány n-1 n
za odhady číselných realizací náhodných veličin zavedených v počtu pravděpodobnosti.
Charakteristika vlastnosti	Počet pravděpodobnosti	Matematická statistika	Popisná statistika
poloha	E(X) = ]i	M	m
variabilita	D(X) = o2	S2	n-1 , -s n
variabilita	Vd(x) = a	S	n-1 V n
společná variabilita	C(Xi, X2) = G12	S12	n-1 S12 n
těsnost vztahu	R(Xi, X2) = p	R12	r 12
rozložení	O(x)	F„(x)	F(x)
Příklad (výpočet realizací výběrového průměru, výběrového rozptylu a hodnot výběrové distribuční funkce): Desetkrát nezávisle na sobě byla změřena jistá konstanta u, Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru Xb    X10. Vypočtěte realizaci m výběrového průměru M, realizaci s2 výběrového rozptylu S2, realizaci s výběrové směrodatné odchylky S a hodnoty výběrové distribuční funkce
Fio(x). Řešení:
,n = -tx. =-(2 + l,8 + ... + 2,2) = 2,06,s2=^-T(xi-m)2 ^í^x,2 -nm2l = ^22 +1,82 +... +2,22 -10-2,062) = 0,0404 ny       10 n-li=1 n-l^i=1 J 9
s = aS7 = V0*0404 =0,2011
Pro usnadnění výpočtu hodnot výběrové distribuční funkce Fi0(x) uspořádáme měření podle velikosti: 1,8 1,8 1,9 2 2 2,1 2,1 2,2 2,3 2,4.
x<l,8:F10(x) = 0 l,8<x<l,9:F10(x)=|p0,2
l,9<x<2:F10(x)=^ = 0,3
2<x<2,l:F10(x)=^- = 0,5
2,l<x<2,2:F10(x)=^- = 0,7
2,2<x<2,3:F10(x)=^ = 0,8
1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5
2,3<x<2,4:F10(x)= — = 0,9
10
x>2,4:F10(x) = l
Příklad (výpočet realizace výběrového koeficientu korelace):
U 11 náhodně vybraných aut jisté značky bylo zjišťováno jejich stáří (náhodná veličina X - v letech) a cena (náhodná veličina Y - v tisících Kč). Výsledky:
(5, 85), (4, 103), (6, 70), (5, 82), (5, 89), (5, 98), (6, 66), (6, 95), (2, 169), (7, 70), (7, 48). Vypočtěte a interpretujte číselnou realizaci rí2 výběrového koeficientu korelace Ri2.
v
Řešení:
m,
m-
-£xí=^(5 + 4 + ... + 7) = 5,28 ntŕ 11
■■-Y y t =—(85 + 103 + . .. + 48) = 88,63 n í=i 11
f n
n-lU
v"1     2 2
Lxi _nmi
i
V i=i
í n
-(52 +42 +... + 72 -ll-5,282) = 2,02
10
n-1 1
nm,,
'12
L12
n-1
S12
V i=i
( n
E^yi-
^i=l
-40,82
-(852 +1032 +... + 482 -11 • 88,632)- 970,85
10
—(5-85 + 4-103 + ... +7-48-11-5,28-88,63)--40,89 10
- -0,92
srs2 V^Ô2->/970,85
Mezi náhodnými veličinami X a Y existuje silná nepřímá lineární závislost. Čím starší auto, tím nižší cena.
Bodové a intervalové odhady parametru a parametrických funkcí
Vycházíme z náhodného výběru X1?     Xn z rozložení L(#), které závisí na parametru ů. Množinu všech přípustných hodnot tohoto parametru označíme H. Tato množina se nazývá parametrický prostor.
Např. je-li X1?     Xn náhodný výběr z rozložení N(jli,o2), pak ů = (|x,o2) a v tomto případě parametrický prostor H = (— oo5oo)x ^0,00).
Parametr ů neznáme a chceme ho odhadnout pomocí daného náhodného výběru (případně chceme odhadnout nějakou parametrickou funkci h($)).
Bodovým odhadem parametrické funkce h($) je statistika Tn = T(X1?     Xn), která nabývá hodnot blízkých h(ů), ať je hodnota parametru ů jakákoliv. Existují různé metody, jak konstruovat bodové odhady (např. metoda momentů či metoda maximální věrohodnosti, ale těmi se zde zabývat nebudeme) a také různé typy bodových odhadů. Omezíme se na odhady nestranné, asymptoticky nestranné a konzistentní.
Intervalovým odhadem parametrické funkce h(ů) rozumíme interval (D, H), jehož meze jsou statistiky
D = D(Xi,     Xn), H = H(Xi,     Xn) a který s dostatečně velkou pravděpodobností pokrývá h(ů), ať je hodnota parametru ů
jakákoliv.
Typy bodových odhadů
Nechť Xi,    Xn je náhodný výběr z rozložení L(ů), h(ů) je parametrická funkce, T, T1? T2, ... jsou statistiky.
a) Řekneme, že statistika T je nestranným odhadem parametrické funkce h(ů), jestliže VôeS: E(T) = h(i3).
(Význam nestrannosti spočívá v tom, že odhad T nesmí parametrickou funkci h(ů) systematicky nadhodnocovat ani podhodnocovat. Není-li tato podmínka splněna, jde o vychýlený odhad.)
b) Jsou-li Ti, T2 nestranné odhady téže parametrické funkce h(ů), pak řekneme, že Ti je lepší odhad než T2, jestliže Vfle S : D(Ti) < D(T2).
c) Posloupnost {Tn}~=1 se nazývá posloupnost asymptoticky nestranných odhadů parametrické funkce h(ů), jestliže \/ůe S : lim E(Tn) = h(ů).
(Význam asymptotické nestrannosti spočívá v tom, že s rostoucím rozsahem výběru klesá vychýlení odhadu.)
d) Posloupnost {Tn}~=1 se nazývá posloupnost konzistentních odhadů parametrické funkce h(ů), jestliže
\/ů e E Ve > 0: lim p(|Tn - h(ů)\ > e) = 0.
(Význam konzistence spočívá v tom, že s rostoucím rozsahem výběru klesá pravděpodobnost, že odhad se bude
realizovat „daleko" od parametrické funkce h(i3).) Lze dokázat, že z nestrannosti odhadu vyplývá jeho asymptotická nestrannost a z asymptotické nestrannosti vyplývá konzistence, pokud posloupnost rozptylů odhadu konverguje k nule.
Vlastnosti důležitých statistik
a) Případ jednoho náhodného výběru: Nechť Xl5Xnje náhodný výběr z rozložení se střední hodnotou u, rozptylem a2 a distribuční funkcí <D(x). Nechť n > 2. Označme Mn výběrový průměr, Sn2 výběrový rozptyl a pro libovolné, ale pevně dané x G R označme Fn(x) hodnotu výběrové distribuční funkce. Pak pro libovolné hodnoty parametrů fi, o2 a libovolné, ale pevně dané reálné číslo x platí: E(Mn) - u,
D(Mn)=^,
E(Sn2) = o2,
D(Sn2) = 1^--—^-—^, kde y4 je 4. centrální moment, n n(n-l)
E(F„(x)) = <t(x),
D(Fi(x))=*WtzíW!
n
Znamená to, že Mn je nestranným odhadem u, Sn2 je nestranným odhadem a2, pro libovolné, ale pevně dané x g r je výběrová distribuční funkce Fn(x) nestranným odhadem <D(x). Posloupnost {mn}^=1 je posloupnost konzistentních odhadů \i,
^n2}n=i Je posloupnost konzistentních odhadů o2,
pro libovolné, ale pevně dané x e r je {Fn(x)}~=1 posloupnost konzistentních odhadů <D(x).
b) Případ r > 2 stochasticky nezávislých náhodných výberu: Nechť xn,...,xln ,     xrl,...,xm je r stochasticky nezávislých
náhodných výberu o rozsazích n! > 2,    nr > 2 z rozložení se středními hodnotami U4,    fir a rozptylem o2. Celkový rozsah
je n = ^iij. Nechť Ci, cr jsou reálné konstanty, aspoň jedna nenulová. Pak pro libovolné hodnoty parametrů (ii, ..., (ir a o2 platí:
f r 'N r
^ j=i J H
E(S*2) = o2.
r
Znamená to, že lineární kombinace výběrových průměrů 2]cjmj Je nestranným odhadem lineární kombinace středních hod-
h
' ±(«,-1)5/
not Z-(Cj^j a vážený průměr výběrových rozptylů S*2 =—-je nestranným odhadem rozptylu o2.
j=i n-r
c) Případ jednoho náhodného výběru z dvourozměrného rozložení: Nechť (X^Y^,    (Xn,Yn) je náhodný výběr
z dvourozměrného rozložení s kovariancí cl2 a koeficientem korelace p. Pak pro libovolné hodnoty parametrů cl2 a p platí:
E(Si2) = a i2,
E(R12) ~ p (shoda je vyhovující pro n > 30).
Znamená to, že výběrová kovariance Si2 je nestranným odhadem kovariance cl2, avšak výběrový koeficient korelace R12 je vychýleným odhadem koeficientu korelace p.
Pojem intervalu spolehlivosti
Nechť Xi,Xn je náhodný výběr z rozložení L(#), h(ů) je parametrická funkce, ae (0,1),
D = D(Xi,    Xn), H = H(Xi,    Xn) jsou statistiky.
a) Interval (D, H) se nazývá 100(l-a)% (oboustranný) interval spolehlivosti pro parametrickou funkci h(#), jestliže: v#e s :P(D < h(ů) < H) > 1-a.
b) Interval (D, oo) se nazývá 100(1-a)% levostranný interval spolehlivosti pro parametrickou funkci h(#), jestliže: \/ůe s :P(D < h(ů)) > 1-a.
c) Interval (-oo, H) se nazývá 100(l-a)% pravostranný interval spolehlivosti pro parametrickou funkci h(fl), jestliže: v-^e s :P(h(d) < H) > 1-a.
Číslo a se nazývá riziko (zpravidla a = 0,05, méně často 0,1 či 0,01), číslo 1 - a se nazývá spolehlivost.
Postup při konstrukci intervalu spolehlivosti
a) Vyjdeme ze statistiky V, která je nestranným bodovým odhadem parametrické funkce h(ů).
b) Najdeme tzv. pivotovou statistiku W, která vznikne transformací statistiky V, je monotónní funkcí h(ů) a přitom její rozložení je známé a na h(ů) nezávisí. Pomocí známého rozložení pivotové statistiky W najdeme kvantily w^, Wi.c/2, takže platí: \/ůe E: PCw^ < W < Wi.^) > 1 - a.
c) Nerovnost      < W < Wi-a/2 převedeme ekvivalentními úpravami na nerovnost D < h(ů) < H.
d) Statistiky D, H nahradíme jejich číselnými realizacemi d, h a získáme tak 100(l-a)% empirický interval spolehlivosti, o němž prohlásíme, že pokrývá h(i3-) s pravděpodobností aspoň 1 - a. (Tvrzení, že (d,h) pokrývá h(i3-) s pravděpodobností aspoň 1 - a je třeba chápat takto: jestliže mnohonásobně nezávisle získáme realizace xi,xn náhodného výběru Xi, Xn z rozložení L(ů) a pomocí každé této realizace sestrojíme 100(l-a)% empirický interval spolehlivosti pro h(ů), pak podíl počtu těch intervalů, které pokrývají h(ů) k počtu všech sestrojených intervalů bude přibližně 1 - a.)
Ilustrace: Jestliže lOOx nezávisle na sobě uskutečníme náhodný výběr z rozložení se střední hodnotou li a pokaždé sestrojíme 95% empirický interval spolehlivosti pro li, pak přibližně v 95-ti případech bude ležet parametr li v intervalech spolehlivosti a asi v 5-ti případech interval spolehlivosti li nepokryje.
Volba oboustranného, levostranného, nebo pravostranného intervalu: závisí na konkrétní situaci.
Např. oboustranný interval spolehlivosti použije konstruktér, kterého zajímá dolní i horní hranice pro skutečnou délku li nějaké součástky.
Levostranný interval spolehlivosti použije výkupčí drahých kovů, který potřebuje znát dolní mez pro skutečný obsah zlata li v kupovaném slitku.
Pravostranný interval spolehlivosti použije chemik, který potřebuje znát horní mez pro obsah nečistot li v analyzovaném vzorku.
2 2
Příklad: Nechť X1? Xn je náhodný výběr z rozložení N(li,o ), kde n > 2 a rozptyl o známe. Sestrojte 100(l-a)% interval spolehlivosti pro neznámou střední hodnotu li.
Řešení: V tomto případě parametrická funkce h(ů) = li. Nestranným odhadem střední hodnoty je výběrový průměr M
1 ^
n
2]x; . Protože M je lineární kombinací normálně rozložených náhodných veličin, bude mít také normální rozložení se
střední hodnotou E(M) = li a rozptylem D(M) = —. Pivotovou statistikou W bude standardizovaná náhodná veličina
n
u = M-U_ ^N((u)_
a
Kvantil Wo/2 = Ua/2 = -Ui-o/2, Wi-o/2 = Ui^.
VŮG S : 1 - tt < PC-Ui.a/2 < U < Ui.a/2) = P
Ul-a/2 <
M-|I
a
< u
l-a/2
M--ž=Ul-a/2 <(^<M + -ž=Ul-a/2
Vn Vn
Meze 100(l-a)% intervalu spolehlivosti pro střední hodnotu li při známém rozptylu o tedy jsou:
D= M--^Ul_a/2,H= M+-^LUl_a/2. Vn Vn
Při konstrukci jednostranných intervalů spolehlivosti se riziko nepůlí, tedy 100(l-a)% levostranný interval spolehlivosti pro
Lije M—^=Uj_a,oo a pravostranný je -°°,M + -=Uj_c V     Vn J y Vn
Dosadíme-li do vzorců pro dolní a horní mez číselnou realizaci m výběrového průměru M, dostaneme 100(l-a)% empirický
interval spolehlivosti. Postup si ukážeme na následujícím numerickém příkladu.
Příklad: 10 krát nezávisle na sobě byla změřena jistá konstanta |u. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2.
Výsledky považujeme za číselné realizace náhodného výběru Xi,     Xi0 z rozložení N(ju, a2), kde |u neznáme a a = 0,04. Najděte 95% empirický interval spolehlivosti pro |u, a to
a) oboustranný,
b) levostranný,
c) pravostranný. Řešení:
Vypočteme realizaci výběrového průměru: m = 2,06. Riziko a je 0,05. V tabulkách najdeme kvantil u0,975 = 1,96 pro oboustranný interval spolehlivosti a kvantil u0,95 = 1,64 pro jednostranné intervaly spolehlivosti.
ad a) d = m - -?= ^-oji = 2,06 - -^L 1.96 = 1,94 vn V10
h = m + -$L Ui-o/2 = 2,06 + -^L 1,96 = 2,18
4^ vio
1,94 < \x < 2,18 s pravděpodobností aspoň 0,95. ad b) d = m -      ui-a = 2,06 - -^L 1,64 = 1,96
1,96 < jli s pravděpodobností aspoň 0,95.
ad c) h = m + -J= Ui_a = 2,06 +       1,64 = 2,16 Vn Vl0
jlx < 2,16 s pravděpodobností aspoň 0,95.
Šířka intervalu spolehlivosti
Nechť (d, h) je 100(l-a)% empirický interval spolehlivosti pro h(ů) zkonstruovaný pomocí číselných realizací xi, xn náhodného výběru Xi,    Xn z rozložení L(i3-).
a) Při konstantním riziku klesá šířka h-d s rostoucím rozsahem náhodného výběru.
b) Při konstantním rozsahu náhodného výběru klesá šířka h-d s rostoucím rizikem.
Příklad: (stanovení minimálního rozsahu výběru z normálního rozložení)
Nechť Xi, Xn je náhodný výběr z N(li, o2), kde o2 známe. Jaký musí být minimální rozsah výběru n, aby šířka 100(l-a)% empirického intervalu spolehlivosti pro střední hodnotu li nepřesáhla číslo A?
Řešení: Požadujeme, aby A > h - d = m + -^=u1_a/2 - (m—^u^^) =-^u1_a/2. Z této podmínky dostaneme, že
Vn vn Vn
n -      ^      . Za rozsah výběru zvolíme nejmenší přirozené číslo vyhovující této podmínce.
Příklad: Hloubka moře se měří přístrojem, jehož systematická chyba je nulová a náhodné chyby měření mají normální rozložení se směrodatnou odchylkou o = 1 m. Kolik měření je nutno provést, aby se hloubka stanovila s chybou nejvýše ± 0,25 m při spolehlivosti 0,95?
Řešení: Hledáme rozsah výběru tak, aby šířka 95% intervalu spolehlivosti pro střední hodnotu li nepřesáhla 0,5 m. Přitom o
4a2Ul_a/22 4-L962
známe. Z předešlého příkladu vyplývá, že n >-—-=   ^ ^2— = 61,4656. Nejmenší počet měření je tedy 62.
Základní typy uspořádání pokusů
Metody matematické statistiky často slouží k vyhodnocování výsledků pokusů. Aby mohl být pokus správně vyhodnocen, musí být dobře naplánován. Uvedeme zde nej jednodušší typy uspořádání pokusů.
Předpokládejme například, že sledujeme hmotnostní přírůstky selat téhož plemene při různých výkrmných dietách.
a) Jednoduché pozorování: Náhodná veličina X je pozorována za týchž podmínek. Situace je charakterizována jedním náhodným výběrem Xi,Xn.
Náhodně vylosujeme n selat téhož plemene, podrobíme je jediné výkrmné dietě a zjistíme u každého selete hmotnostní přírůstek. Tím dostaneme realizaci jednoho náhodného výběru.
b) Dvojné pozorování: Náhodná veličina X je pozorována za dvojích různých podmínek. Existují dvě odlišná uspořádání tohoto pokusu.
Dvouvýběrové porovnávání: situace je charakterizována dvěma nezávislými náhodnými výběry Xn,.. .,Xln a X21,.. •,X2ll2.
Náhodně vylosujeme ni a n2 selat téhož plemene, náhodně je rozdělíme na dva soubory o ni a n2 jedincích, první podrobíme výkrmné dietě č. 1 a druhý výkrmné dietě číslo 2. Tak dostaneme realizace dvou nezávislých náhodných výběrů.
Párové porovnávání: situace je charakterizována jedním náhodným výběrem (Xx l, X12),..., (Xnl, Xn2)
z dvourozměrného rozložení. Přejdeme k rozdílovému náhodnému výběru Zj = Xn - Xi2, i = 1, ..., n a tím dostaneme jednoduché pozorování.
Náhodně vylosujeme n vrhů stejně starých selat téhož plemene, z každého odebereme dva sourozence a náhodně jim přiřadíme první a druhou výkrmnou dietu. Tak dostaneme realizaci jednoho dvourozměrného náhodného výběru, kde první složka odpovídá první dietě a druhá složka druhé dietě.
(Párové porovnávání je efektivnější, protože skutečný rozdíl v účinnosti obou diet je překrýván pouze náhodnými vlivy při samotném krmení a trvání, kdežto vliv různých dědičných vloh, který byl losováním znáhodněn, je u sourozeneckého páru selat částečně vyloučen.)
c) Mnohonásobné pozorování: Náhodná veličina X je pozorována za r > 3 různých podmínek. Existují dvě odlišná uspořádání tohoto pokusu.
Mnohovýběrové porovnávání: situace je charakterizována r nezávislými náhodnými výběry Xu,..., Xln až Xrl,..., Xrn .
Náhodně vylosujeme n:, n2, ..., nr selat téhož plemene, náhodně je rozdělíme na r souborů o n:, n2, ..., nr jedincích, první podrobíme výkrmné dietě č. 1, druhý výkrmné dietě číslo 2 atd. až r-tý podrobíme výkrmné dietě číslo r. Tak dostaneme realizace r nezávislých náhodných výběrů.
Blokové porovnávání: situace je charakterizována jedním náhodným výběrem (Xn,..., Xlr),..., (Xnl,..., Xnr) z r-rozměrného rozložení.
Náhodně vylosujeme n vrhů stejně starých selat téhož plemene, z každého odebereme r sourozenců a náhodně jim přiřadíme první až r-tou výkrmnou dietu. Tak dostaneme realizaci jednoho r-rozměrného náhodného výběru, kde první složka odpovídá první dietě , druhá složka druhé dietě atd. až r-tá složka odpovídá r-té dietě.
Úvod do testování hypotéz
Motivace: Častým úkolem statistika je na základě dat ověřit předpoklady o parametrech nebo typu rozložení, z něhož pochází náhodný výběr. Takovému předpokladu se říká nulová hypotéza. Nulová hypotéza vyjadřuje nějaký teoretický předpoklad, často skeptického rázu a uživatel ji musí stanovit předem, bez přihlédnutí k datovému souboru. Proti nulové hypotéze stavíme alternativní hypotézu, která říká, co platí, když neplatí nulová hypotéza. Alternativní hypotéza je formulována tak, aby mohla platit jenom jedna z těchto dvou hypotéz. Pravdivost alternativní hypotézy by znamenala objevení nějakých nových skutečností, nebo zásadnější změnu v dosavadních představách.
Např. výzkumník by chtěl na základě dat prověřit tezi (nový objev), že pasivní kouření škodí zdraví. Jako nulovou hypotézu tedy položí tvrzení, že pasivní kouření neškodí zdraví a proti nulové hypotéze postaví alternativní, že pasivní kouření škodí zdraví.
Testováním hypotéz se myslí rozhodovací postup, který je založen na daném náhodném výběru a s jehož pomocí rozhodneme o zamítnutí či nezamítnutí nulové hypotézy.
Nulová a alternativní hypotéza
Nechť Xi,Xn je náhodný výběr z rozložení L(#), kde parametr ůe z neznáme. Nechť h(ů) je parametrická funkce a c daná reálná konstanta.
a) Oboustranná alternativa: Tvrzení H0: h(ů) = c se nazývá jednoduchá nulová hypotéza. Proti nulové hypotéze postavíme složenou oboustrannou alternativní hypotézu Hi: h(ů) * c.
b) Levostranná alternativa: Tvrzení H0: h(ů) > c se nazývá složená pravostranná nulová hypotéza. Proti jednoduché nebo složené pravostranné nulové hypotéze postavíme složenou levostrannou alternativní hypotézu Hi: h(ů) < c.
c) Pravostranná alternativa: Tvrzení H0: h(ů) < c se nazývá složená levostranná nulová hypotéza. Proti jednoduché nebo složené levostranné nulové hypotéze postavíme složenou pravostrannou alternativní hypotézu Hi: h(ů) > c.
Testováním H0 proti Hi rozumíme rozhodovací postup založený na náhodném výběru Xi,Xn, s jehož pomocí zamítneme či nezamítneme platnost nulové hypotézy.
Chyba 1. a 2. druhu
Při testování H0 proti H! se můžeme dopustit jedné ze dvou chyb: chyba 1. druhu spočívá v tom, že H0 zamítneme, ač ve skutečnosti platí a chyba 2. druhu spočívá v tom, že H0 nezamítneme, ač ve skutečnosti neplatí. Situaci přehledně znázorňuje tabulka:
skutečnost	rozhodnutí	
	H0 nezamítáme	H0 zamítáme
H0 platí	správné rozhodnutí	chyba 1. druhu
H0 neplatí	chyba 2. druhu	správné rozhodnutí
Pravděpodobnost chyby 1. druhu se značí a a nazývá se hladina významnosti testu (většinou bývá a = 0,05, méně často 0,1 či 0,01). Pravděpodobnost chyby 2. druhu se značí p\ Číslo 1-P se nazývá síla testu a vyjadřuje pravděpodobnost, že bude H0 zamítnuta za předpokladu, že neplatí. Obvykle se snažíme, aby síla testu byla aspoň 0,8. Obě hodnoty, a i l-p\ závisí na velikosti efektu, který se snažíme detekovat. Čím drobnější efekt, tím musí být větší rozsah náhodného výběru.
skutečnost	rozhodnutí	
	zdravý	nemocný
jsem zdravý	zdravý a neléčený	zdravý a léčený
jsem nemocný	nemocný a neléčený	nemocný a léčený
Testování pomocí kritického oboru
Najdeme statistiku T0 = To(Xl9     Xn), kterou nazveme testovým kritériem. Množina všech hodnot, jichž může testové kritérium nabýt, se rozpadá na obor nezamítnutí nulové hypotézy (značí se V) a obor zamítnutí nulové hypotézy (značí se W a nazývá se též kritický obor). Tyto dva obory jsou odděleny kritickými hodnotami (pro danou hladinu významnosti a je lze najít ve statistických tabulkách).
Jestliže číselná realizace t0 testového kritéria T0 padne do kritického oboru W, pak nulovou hypotézu zamítáme na hladině významnosti a a znamená to skutečné vyvrácení testované hypotézy. Jestliže t0 padne do oboru nezamítnutí V, pak jde o pouhé mlčení, které platnost nulové hypotézy jenom připouští. Pravděpodobnosti chyb 1. a 2. druhu nyní zapíšeme takto: P(T0 e W/Ho platí) = a, P(T0 e V /Hi platí) = p\
Stanovení kritického oboru pro danou hladinu významnosti a:
Označme tmin (resp. tmax) nejmenší (resp. největší) hodnotu testového kritéria.
Kritický obor v případě oboustranné alternativy má tvar
W = (t^, Ka/2(T)) u (Kj a/2(T), tmax), kde Ko(/2(T) a Ki^CO Jsou kvantily rozložení, jímž se řídí testové kritérium T0, je-li nulová hypotéza pravdivá.
Kritický obor v případě levostranné alternativy má tvar:
W= (tmin,Ka(T)).
Kritický obor v případě pravostranné alternativy má tvar: W= (T),tmJ.
Testování pomocí intervalu spolehlivosti
Sestrojíme 100(l-a)% empirický interval spolehlivosti pro parametrickou funkci h(i3). Pokryje-li tento interval hodnotu c, pak H0 nezamítáme na hladině významnosti a, v opačném případě H0 zamítáme na hladině významnosti a. Pro test H0 proti oboustranné alternativě sestrojíme oboustranný interval spolehlivosti.
\-(   \--(
Pro test H0 proti levostranné alternativě sestrojíme pravostranný interval spolehlivosti.
——————I
---\-"-
Ho HČÄltíii'ttíW
Pro test H0 proti pravostranné alternativě sestrojíme levostranný interval spolehlivosti.
Testování pomocí p-hodnoty
p-hodnota udává nejnižší možnou hladinu významnosti pro zamítnutí nulové hypotézy. Je to riziko, že bude zamítnuta H0 za předpokladu, že platí (riziko planého poplachu). Jestliže p-hodnota < a, pak H0 zamítáme na hladině významnosti a, je-li p-hodnota > a, pak H0 nezamítáme na hladině významnosti a. Způsob výpočtu p-hodnoty:
Pro oboustrannou alternativu p = 2 min{P(T0 < t0), P(T0 > to)}. Pro levostrannou alternativu p = P(T0 < t0). Pro pravostrannou alternativu p = P(T0 > t0).
Ilustrace významu p-hodnoty pro test nulové hypotézy proti oboustranné, levostranné a pravostranné alternativě:
(Zvonovitá křivka reprezentuje hustotu rozložení, kterým se řídí testové kritérium, je-li nulová hypotéza pravdivá.)
p-hodnota vyjadřuje pravděpodobnost, s jakou číselné realizace x1?xn náhodného výběru X1?Xn podporují H0, je-li pravdivá. Statistické programové systémy poskytují ve svých výstupech p-hodnotu. Její výpočet vyžaduje znalost distribuční funkce rozložení, kterým se řídí testové kritérium T0, je-li H0 pravdivá.
Doporučený postup při testování hypotéz
1. Stanovíme nulovou hypotézu a alternativní hypotézu. Přitom je vhodné zvolit jako alternativní hypotézu ten předpoklad, jehož přijetí znamená závažné opatření a mělo by k němu dojít jen s malým rizikem omylu.
2. Zvolíme hladinu významnosti a. Zpravidla volíme a = 0,05, méně často 0,1 nebo 0,01.
3. Najdeme vhodné testové kritérium a na základě zjištěných dat vypočítáme jeho realizaci.
4.
a) Testujeme-li pomocí kritického oboru, pak ho stanovíme. Jestliže realizace testového kritéria padla do kritického oboru, nulovou hypotézu zamítáme na hladině významnosti a a přijímáme alternativní hypotézu. V opačném případě nulovou hypotézu nezamítáme na hladině významnosti a.
b) Testujeme-li pomocí intervalu spolehlivosti, vypočteme empirický 100(l-a)% interval spolehlivosti pro parametrickou funkci h(ů). Pokud číslo c padne do tohoto intervalu, nulovou hypotézu nezamítáme na hladině významnosti a. V opačném případě nulovou hypotézu zamítáme na hladině významnosti a a přijímáme alternativní hypotézu.
c) Testujeme-li pomocí p-hodnoty, vypočteme ji a porovnáme ji s hladinou významnosti a. Jestliže p < a, pak nulovou hypotézu zamítáme na hladině významnosti a a přijímáme alternativní hypotézu. Je-li p > a, pak nulovou hypotézu nezamítáme na hladině významnosti a.
5. Na základě rozhodnutí, které jsme učinili o nulové hypotéze, provedeme nějaké konkrétní opatření, např. seřídíme obráběcí stroj.
(Při testování hypotéz musíme mít k dispozici odpovídající nástroje, nejlépe vhodný statistický software. Nemáme-li ho k dispozici, musíme znát příslušné vzorce. Dále potřebujeme statistické tabulky a kalkulačku.)
Příklad: 10 x nezávisle na sobě byla změřena jistá konstanta li. Výsledky měření byly     1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru Xi,    X10 z rozložení N(li, 0,04). Nějaká teorie tvrdí, že li = 1,95.
1. Oboustranná alternativa
Proti nulové hypotéze H0: \i= 1,95 postavíme oboustrannou alternativu
Hi: li * 1,95. Na hladině významnosti 0,05 testujte H0 proti Hi všemi třemi popsanými způsoby. Řešení:
m= J-(2 + ... + 2,2) = 2,06, o2 =0,04, n = 10, a = 0,05, c = 1,95 a) Test provedeme pomocí kritického oboru.
Pro úlohy o střední hodnotě normálního rozložení při známém rozptylu používáme pivotovou statistiku U = M^ - ~ N(0, 1).
Vn
Testové kritérium tedy bude
To = M~C a bude mít rozložení N(0, 1), pokud je nulová hypotéza pravdivá. Vypočítáme realizaci testového kritéria:
to = 20 q 2^ =1'74. Stanovíme kritický obor: Vlč
W= (t^.K^CT^U^K^/aíT),^) = (-«»,ua/2)u(uI_a/2,oo) = (-«»,-ulH1/2) U (u^.oo) = (-°°,-u0975)u(u0 975,oo) = (-oo,-l,96)u(l,96,oo).
Protože 1,74 £ W, H0 nezamítáme na hladině významnosti 0,05.
b) Test provedeme pomocí intervalu spolehlivosti.
Meze 100(l-a)% empirického intervalu spolehlivosti pro střední hodnotu (i při známém rozptylu a2 jsou:
(d, h) = (m -        Ui-a/2, m + -^L Ui-afc). Vn vn
V našem případě dostáváme:
d = 2,06 - -^Luo 975 = 2,06 -      .1,96 = 1,936, VIO   " VIO
h = 2,06 + -°^u0 975 = 2,06 + ^jL. 1,96 = 2,184. Vio   ' VIO
Protože 1,95 e (1,936; 2,184), H0 nezamítáme na hladině významnosti 0,05.
c) Test provedeme pomocí p-hodnoty.
Protože proti nulové hypotéze stavíme oboustrannou alternativu, použijeme vzorec p = 2 min{P(T0 < to), P(T0 > t0)} = 2 min {P(T0 < 1,74), P(T0 > 1,74)} = = 2 min { 0(1,74), 1 - 0(1,74) } = 2 min { 0,95907, 1 - 0,95907 } = 0,08186. Jelikož 0,08186 > 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05.
2. Levostranná alternativa
Proti nulové hypotéze H0: \i = 1,95 postavíme levostrannou alternativu
Hi: fx < 1,95. Na hladině významnosti 0,05 testujte H0 proti Hi všemi třemi popsanými způsoby. Řešení:
a) Test provedeme pomocí kritického oboru.
Na rozdíl od oboustranné alternativy bude mít kritický obor tvar W = (- oo, ua) = (- oo, u0,05) = (- --1,645).
Protože 1,74 i W, H0 nezamítáme na hladině významnosti 0,05.
b) Test provedeme pomocí intervalu spolehlivosti.
Meze 100(l-a)% empirického pravostranného intervalu spolehlivosti pro střední hodnotu [i při známém rozptylu o2 jsou:
(-oo, h) = (-oo, m + Ui.o).
Vn
V našem případě dostáváme: h = 2,06 + -^Lu095 = 2,06 +      .1,645 = 2,164. Protože 1,95 e (-oo; 2,164), H0 nezamítáme na hladině významnosti 0,05.
c) Test provedeme pomocí p-hodnoty.
Protože proti nulové hypotéze stavíme levostrannou alternativu, použijeme vzorec p = P(T0 < t0) = 0(1,74) = 0,95907.
Jelikož 0,95907 > 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Ilustrace významu p-hodnoty pro levostranný test
0,45 0,40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0 00 -0 05
' -3.0 -2,5 -2,0 -1.5 -1.0 -0.5 0.0   0.5   1,0   1 5   2 0   2 5   3 0
1 74
3. Pravostranná alternatíva
Proti nulové hypotéze H0: ji = 1,95 postavíme pravostrannou alternativu
Hi: n > 1,95. Na hladině významnosti 0,05 testujte H0 proti Hi všemi třemi popsanými způsoby. Řešení:
a) Test provedeme pomocí kritického oboru.
Na rozdíl od oboustranné alternativy bude mít kritický obor tvar
W= (Ul_a,oo) = (u0i95,oo) = (1,645, oo).
Protože 1,74 e W, H0 zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternativy.
b) Test provedeme pomocí intervalu spolehlivosti.
Meze 100(l-a)% empirického levostranného intervalu spolehlivosti pro střední hodnotu (i při známém rozptylu a2 jsou:
(d, oo) = (m - -ÍL ui_a, oo). vn
V našem případě dostáváme: d = 2,06 - ^=u095 = 2,06 -      .1,645 = 1,956.
Vio   ' V10
Protože 1,95 í (1,956, co), H0 zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternativy.
c) Test provedeme pomocí p-hodnoty.
Protože proti nulové hypotéze stavíme pravostrannou alternativu, použijeme vzorec p = P(T0 > to) = 1 - 0(1,74) = 1 - 0,95907 = 0,04093.
Jelikož 0,04093 < 0,05, nulovou hypotézu zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternatívy.
Ilustrace významu p-hodnoty pro pravostranný test
0.45
0.40 0,35 0,30 0.25 0.20 015 0.10 0,05 0,00 -0.05
												
												
												
												
												
												
											0 04093	
												
												
									1 74			
-3.0 -2.5 -2,0 -1.5 -1,0 -0.5 0.0   0.5   1.0   1.5   2,0   2,5 3.0