MW t M UNIVERZITA J. E. PURKYIME Knihovna PřF MU 3145010011 Fakulta přírodovědecká |if* STATISTICKÉ ZPRACOVÁNÍ VÝSLEDKU _ i - - . ■ . * Íll ■ MĚŘENÍ Josef HUMLÍČEK MASARYKOVA UNIVERZITA V BRNĚ Přírodovědecká lakulta 9840 ÚSTŘEDNÍ KMIHOVNA 611 37 Brno, Kotlářská 2 Mosarykova univerzita prlr-.-ic-'éJ 8 'a' _____ ? ÔtfáU- ... y.: j. ipv, c........Vi.'-------j ...... - Depo v m....................UrC.............. -777 .. BRNO 1984 3145010011 V každém konkrétním měření je třeba zvládnout řadu problému, větSinou specifických pro danou úlohu- Správnost zjištěných hodnot záleží především na potlačení systematických chyb, způsobených mořicími přístroji nebo nevhodným postupem. Jádro tohoto problému vystihuje jednoduchý příklad: kratSím metrem naměříme nesprávné (příliB velká) délky. Práce spojené s odstraněním možných systematických chyb představuje obvykle značnou část námahy vynaložená na celé měření. Přes obrovskou různorodost mají měřeni výrazný společný rys. Je jim fakt, že opakování za stejných podmínek nedává přesně stejné výsledky. Jednak se uplatňují náhodné chyby měřeni, nebo se také samotné studované objekty projevují v náhodných jevech, která se řídí pouze pravděpodobnostními zákony (měření v mikrosvete). Potřebné informace ze souboru naměřených dat, ve kterém jsou patrné náhodné vlivy, získáváme vhodným statistickým zpracováním. Popisem náhndných jevů se zabývá teorie pravděpodobnosti, zpracováním pozorovaných náhodných výsledků další matematické disciplína - statistika. Statistika používá pojmů a výsledků teorie pravděpodobnosti; v kapitole I tohoto skripta jsou potřebné základy vyloženy. K pochopení statistických metod je třeba porozumět pravděpodobnostnímu popisu náhodných jevů a zvládnout použití náhodných proměnných. Užitečné je i podrobnější Beznémení s několika typy často používaných rozdělení, které je rovněž soustředěno do kapitoly I. Základní statistickou úlohou je zjištování hodnot parametrů zkoumaného objektu z naměřených dat. Metody statistického odhadu parametrů jsou obsahem kapitoly II. Velké pozornost je věnována příkladům; je možné, že pro řadu čtenářů by mohly být právě tyto příklady vhodnými "vstupními body" do studované problematiky. Výklad statistických testů hypotéz v kapitole III je stručný, možnost posoudit roz dělení dat pomocí teBtů dobré shody by vSak měla být považována za důležitou. K dalšímu studiu je k dispozici rozsáhlá literatura, z dostupných pramenů jsem vybral jen malou Část. Zacházení s výsledky měření může bý^ pobídkou k přemýšlení o základech matematiky náhody. Myslím, že by bylo chybou podceňovat elementární úvahy o pravděpodobnosti, které najdeme v několika dobrých populárních knihách. Brno, červen 1983 Josef Humlffiek _ 4 -Obsah I. Základní pojmy teorie pravdSpodobnosti 1. Pravděpodobnoet jevů Klasická, statistické a moderní definice,, Podmíněná pravděpodobnost. Nezávislost náhodných jevu. Pravidla pro výpočet pravděpodobnosti, Bayesův teorém* 2. Náhodné proměnná 9 Diskrétní funkce rozdělení. Hustota pravděpodobnosti Funkce náhodné proměnné. Distribuční funkce- Náhodná vektory. Marginální a podmíněné rozdělení. Nezávislost náhodných proměnných. Výsledky měření ~ hodnoty náhodných proměnných. Dva příklady měření. 3. Vlastnosti náhodných proměnných c E 16 Střední hodnota,, Disperze. Střední kvadratická odchylka. Medián a móda. Momenty. Asymetrie £ excesc Momenty náhodného vektoru. Disperze, kovariancef korelační koeficiente Lineární funkce. Hustota součtu a podílu,, Přibližné formule pro střední hodnotu a disperzi (přenos chyb). Charakteristická funkce. 4. Normální rozdělení O..oooc, 22 Hustota, momenty, distribuční funkce. Integrál pravděpodobnosti. Standardní odchylka. Lineární funkce normálně rozdělených proměnných. 5. Zákon velkých čísel a centrální limitní věta 2? Slabý a silný zákon velkých Čísels Limitní rozdělení "„V průměru. Příklad součtu rovnoměrně rozdělených čísel. ť>„ Vícerozměrné normální rozdělení ,„<,,, = 28 Hustota pravděpodobnosti. Kovářianční matice a formac Dvojrozměrná rozdělení. Elipsy konstantní hustoty„ Pravděpodobnostní obsah eliptických a obdélníkových oblastí. Význam korelačního koeficientu. 7. Binomické a Poissonovo rozdělení cac 32 6. Studentovo a F- rozdělení „„„„„„„ 34 9. Dslôí modelová rozdělení, souvislost některých rozdělení 40 II, Odhad parametrů 10, Metody statistického odhadu parametrů i ,, ■„ „ 0 9 ^ 45 Přímo s nepřímo měřené hodnoty,, Konzistence a nestraň-nost odhadu* Efektivnost* Odhad intervalem a oblastí hodnot. Metoda maximální věrohodnosti; Metoda nejmen-ších čtverců. Rozdělení äat„ Poznámka o inverzní pravděpodobnosti, 11, Příklad měření časového intervalu • •'*<«*• v 50- Odhad etřední hodnoty e disperze* Odhad intervalem.. Kontrola pravděpodobnostního ohsahu« Rozdělení dat„ B I I í I - 5 - 12. Odhad přímo měřených hodnot ....... 57 Tfáhy. Disperze pro jednotkovou váhu. Odhad střední hodnoty. Odhad intervalem při známé disperzi. Odhad disperze. Odhad intervalem při odhadované disperzi. Kontrola rozdělení dat. Nápadně vybočující hodnoty. 13. Příklad měření doby Života částice ....... 62 Odhad střední hodnoty exponenciálního rozdělení. Výsledky simulovaného experimentu. 14. Odhad oolohy symetrického rozděleni . ....... 65 Optimální odhady pro několik modelových rozdělení. Asymptotické disperze. Vyrovnaný průměr. Příklad dvou odhadů polohy rovnoměrného rozdělení. 15. Příklad odhadu dvou parametrů lineárního modelu ....... 68 Odhad při normálním rozděleni dat. Maximální věrohodnost a nejmenší čtverce. Výsledky simulovaného měření. Odhody eliptickou oblastí. Intervalové odhady jednotlivých parametrů. Pokus s jiným rozdělením dat. 16. Odhad parametrů lineárního modelu ....... 76 Lineární model. Odhad parametrů. Odhad elipsoidem při známé disperzi. Odhad disperze. Odhad elipsoidem při odhadovaná disperzi. Intervalové odhady jednotlivých parametrů. Souvislost se sumou čtverců odchylek. 17. Odhad parametrů nelineárního modelu 80 Nelineární model. Maximální věrohodnost a nejmenší čtverce. Lineární přiblížení.' 18. Příklad odhadu parametrů nelineárního modelu ....... 81 Proložení modelu simulovanými daty (Lorentzův profil). Suma čtverců v okolí minima. Odhad intervalem. Vliv zadání pevných hodnot některých parametrů. III. Testy hypotéz_____■ 19. Statistické testy hypotéz ....... 86 Souvislost odhadu a testu. Jednoduchá a složené hypotéza. Chyby prvního a druhého druhu. Kritická oblast. Síla testu. Příklad testu zvětšení střední hodnoty. Testy dobré shody. - 6 - 20. Fearsonův teat dobré shody ....... 8í Histogram. Pearsoniiv %2- test. Příklad použiti -- dáta ze spektrometru. Volba buněk histogramu. 21. Kolmogorovův teat dobré shody ....... 9; Empirická distribuSní funkce. Kolmogorovův test. Test 'rozdělení dat z §11. Test rozdělení dat ze spektrometru. Dodatky EL. Tabulka X2- rozdělení....... 95 D2. Tabulka Studentova rozdělení 96 D3. Tabulka F- rozdělení ....... ,97 Literatura......*- 1Q1 - 7 - I. Základni pojmy teorie pravděpodobnosti lt Pravděpodobnost jevů V současné době je známo několik různých způsobů, jak definovat kvantitativně pravděpodobnost. Uvedeme tři možnosti, z nichž každé je svým způsobem výhodná a jejich srovnání je užitečné pro pochopení prob3 mů stojících v cestě zavedení univerzální definice. Klasická definice Pravděpodobnost P(X) určitého jevu X určujeme pomocí souboru tzv, elementárních událostí $ označíme je ^....jE^. To jsou navzájem se vyl* Čujícť jevy (naatane-li jeden z nich, nemůže nastat žádný jiný), o kterých předpokládáme, že jbou "stejně pravděpodobné", nebo "stejně možné" Pojem stejné pravděpodobnosti pokládáme zá základní a nesnažíme se ho č finovat. Jestliže se událost X dá vyjádřit jako sjednocení některé m-ti různých elementárních událostí Ct.j. jako jev, při kterém nastane E. r Kl bo nebo ... nebo se všemi k^,...,km navzájem různými), položíme 2 m P(X)=m/n. Pro pravděpodobnost elementárních událostí máme tedy P(E^)=1/ pro všechna i=l,i...,n. Podstatná část klasické definice se dá vyjádřit následující formulací: počet příznivých případů . pravděpodobnost = pocet všech možných případů * (1) Ihned je ovšem třeba doplnit, že všechny možné případy musí být stejně pravděpodobné.Vyhledaní množiny elementárních událostí je obvykle založeno na symetrii objektů, které se daného jevu účastní (házení ideální kostkou, ruleta apod.). Není-rlí počet všech možných případů konečnýt ai zůstává možnost zdůvodnit stejnou pravděpodobnost některých podmnožin všech jevů, lze definici Cl) v podstatě zachovat. Namísto počtu případů je nutné použít vhodnou míru velikosti oblastí, reprezentujících přízni vé a všechny možné případy (délky, plochy atd)* V učebnicích teorie pra děpodobnosti se v těchto okolnostech používá termínu geometrické pravdě podobnosti. Statistická definice Označme počet pokusů, ve kterých je sledován náhodný jev X, symbolem N* Jestliže v M případech jev X nastal (ve zbylých N-M nenastal), nr žeme definovat pravděpodobnost X jako limitu relativní četnosti M/N při N jdoucím k nekonečnu: P(X) = lim . (2) Pravděpodobnosti nemožného a jistého jevu jsou tedy po řadě 0 a 1; je-1: X sjednocením konečného počtu vzájemně se vylučujících jevů A^,...,^, je zřejmě P(X)=P(A1)+..,+P(Ak). Tato definice vyjadřuje intuitivně zřejmou souvislost mezi pravděpodobností jevu a jeho četností při opakovaných pokusech. Ačkoliv nekonečnou řadu pokusů nelze realizovat,_předpo- - 8 ~ klédéme, že o rostoucím počtem N se relativní četnost blíží k limitní (i když třeba neznámé)hodnotě (2). Moderní definice Pravděpodobnost je definovaná jako Číselná míra na množině F väech možných jevu (ke každému jevu z F je přiřazeno číslo P), splňující následující axiomy: (a) P(X>£-0 pro všechny jevy XeF; (b) P(U) = 1 pro jistý jev U(t.j. pro takový jev U, který nastává vždycky); <3) (c) PÍA^ nebo nebo ...) * p(A1)+P(A2)+.pro libovolné vzájem- ně se vylučující jevy A^,A2,... Vlastnosti pravděpodobnosti z klasické a statistické definice jsou zachovány, chybí jen předpis pro konkrétní přiřazení numerických hodnot pravděpodobností jednotlivým jevům. To je přirozený důsledek požadavku, aby aparát teorie pravděpodobnosti mohl popisovat stejné množiny náhodných jevů, které se liší hodnotami pravděpodobností. Například při házení ideální kostkou je P(l)=...=P(6)=l/6 (1,...,6 znamená výsledek hodu)j odchylka od ideálního stavu vede k tomu, Že se pravděpodobnosti liší od 1/6 a jejich hodnoty je třeba zjistit. Metody teorie pravděpodobnosti však fungují stejně v obou případech. Pokusme se zformulovat hodnocení uvedených třech způsobů definice pravděpodobnosti. Pravděpodobnostní míra zavedená V moderní definici (3) reprezentuje podstatnou stránku společnou náhodným jevům; je vhodná pro logickou výstavbu matematické teorie. Klasický přistup (1) prokáže mnohdy cenné služby proto, že vyplňuje kostru obecných požadavků hodnotami pravdepodobností. I když velmi Často potřebnou množinu stejně pravděpodobných elementárních událostí nenajdeme, nemá cenu klasickou definici odmítnout; tím bychom se ochudili o mnoho podstatných výsledků. Statistickou definici (2) považují někteří autoři za jedině správnou. V souvislosti se dvěma druhými alternativami se však přikloníme k chápání vztahu (2) jako prostředku k určení numerických hodnot pravděpodobnostní míry z moderní definice. . Podmíněná pravděpodobnost Pravděpodobnost náhodného jevu A za předpokladu, že nastává jev B, se nazývá podmíněnou pravděpodobností.. Značí se symbolem P(A|B) a je definována pomocí pravděpodobnosti jevu AaB (t.j. jak A tak E současně) následujícím vztahem:_ P(AaB) = P(B)P(A|B). (4) P(A|B) je definována jen tehdy, je-li P(B)>0. Nezávislost náhodných jevů Dva náhodná jevy A,,A,, se nazývají nezávislé, jestliže - 9 - .1 PUiaA2) = P(A1)P(A2)I neboli P(A1|A2) = P(A]L), PÍA^A^ = P(A2>. { Pojem nezávislosti náhodných jevů je velmi důležitý a budeme ae s ním často setkávat. Hořejäl definice se však prakticky ke zjištění nezávislosti nepoužívá. Obvykle využijeme empirických poznatků k tomu, abychom rozhodli o správnosti tvrzení, Že dva jevy spolu "nijak nesouvisí", a tuto nazévislost vyjádříme formálně vztahem (5). j Jednoduché pravidla Pro pravděpodobnost, že jev A nenastane (neboli nastane jev, který označíme bu3 ne A, nebo A), vychází P(A) = l-P(A). (6i Pravděpodobnost, že nastane alespoň jeden ze dvou jevů A,B je P(A nebo B) = P(A)+P = lim MM .. (1) ľ äx-*0 Ax Pravděpodobnost, že hodnoty £ jsou z intervalu ^x, ^ +Ax) je tedy pro dostatečně malé &x .úměrná délce intervalu a koeficientem úměrnosti je hustota f| (x), neboli "pravděpodobnost na jednotkovou délku intervalu". Protože hustota je obecně funkcí x, dostaneme pravděpodobnost pro konečný interval ^x^, x2) integrací: x2 PCx-L^J^a^) = J f| = p^cz-z^ ; p2s-(z-z2); d-p^) ^Lesp (33 je hustotou náhodné proměnné ^, která nabývá hodnot z^, z^ s pravděpodobnostmi P^> V2 a libovolných reálných hodnot různých ód z^, z2 s hustotou danou třetím členem na pravé straně vzorce (3). Aby byl splněn požadavek pravděpodobnosti jistého jevu (viz (1.3)), musí platit ?"PtCyi) = 1» £?j U) dx = 1 (4) pro libovolnou náhodnou proměnnou £ (diskrétní) a J (spojitou, vně intervalů možných hodnot položíme hustotu rovnou nule). Z této normovači podmínky vychází faktor u exponenciální funkce ve vztahu (3). Funkce náhodné proměnné Je-li ^ náhodná proměnná s hustotou f^ (x) a h(x) zadaná funkce s hodnotami y = híxí, mažeme přenést pravděpodobnostní míru z intervalů hodnot x do intervalů hodnot y, které jsou pak hodnotami nové náhodné proměnné (označme ji Je-li transformace y = h(x) vzájemně jednoznačná, přechází interval 0 a x* -Vy pro x<0. Odtud dostaneme Distribuční funkce K úplnému zadání náhodné proměnné ý se vedle diskrétní funkce rosdělení Pý(x^) nebo hustoty pravděpodobnosti f j íx) výborně hodí distribuční funkce Fj(x) reálného argumentu xč(-cotoo)( definovaná vztahe» Fj(x> = P(f < x) (8) pro diskrétní i spojité Souvislost s hustotou spojité náhodné proměnné je podle (2) následující: x V »t (x) -Vft(t)dt, fr(x) » dFj(x> -.. (9) J .4ř ?. dx Druhá z hořejších formulí platí jen tehdy, existuje-li v bodě x derivace* Funkce Ft (x) má podle definice (8) skok velikosti F(x^) v každém bodě x^, pro který je pravděpodobnost P(x^) nenulová. Distribuční funkce je nekle-sající, podle vztahu (4) jsou její krajní funkční hodnoty 0 a I. Diskrétní funkci rozdělení, hustotě nebo distribuční funkci se stručně říká rozdělení náhodné proměnné. Vícerozměrné náhodné proměnné Některé náhodné jevy je třeba popisovat několika reálnými Čísly. Uspořádané n-tice reálných čísel íx1,...)xn>, která je přirazena pravděpodobnostní míra, tvoří hodnotu n-rozměrné náhodné proměnné. Často se používá taká názvů náhodný vektor nebo soustava náhodných proměnných. Diskrétní náhodný vektor 'je určen pravděpodobnostmi P(x^,...,xn) toho, že jednotlivé složky nabudou diskrétních hodnot ^1,I:12* "* * ,xnlřXn2»"0 * * Hodnotám (x1,,,.,xn) gpojitého náhodného vektoru_£( podtržením symbolu zdůrazňujeme, že jde o veličinu s několika komponentami. ý^,£n) je přiřazena hustota pravděpodobnosti f4 (x, .....xn) « lim a ... a ^j^). *■ fi,x1-»0,...,áin-rO Ax^.-.Zo^ (10) - 12 - Distribuční funkce je definována zobecněním vztahu (8): F^íl^,...,^) cP<íi- (11) Souvislost hustoty a distribuční funkce je analogií první.z formulí (9): F^íx1,...,xn) = > ... ^ r^(tlf ...,tn) d^ ... dtn. (12) Pravděpodobnost nalezení funkčních hodnot v zadané oblasti 52. je P(_£6&) ■ fjít-p...,^) dtx ... dtn. (13) Marginálni a podmíněné rozdělení Projekce funkcí charakterizujících rozdělení pravděpodobností nehodného vektoru do "směrů" jeho komponent jsou označovány jako marginální rozdělení. Například oo co f t (x-j^) H ^«.« I í" & (xi» t2» • •. »tn) dt2 ... dtn, -co -oo ^l^i5 = F^.Í3Cl»o0»***»c,o) . XU) jsou marginální hustotou a marginální distribuční funkcí proměnné Tyto funkce urfiují pravděpodobnosti intervalů proměnné bez ohledu na hodnoty zbylých komponent Řezy rozdělovačích funkcí (jedna nebo několik komponent zadány pevně) se nazývají podmíněné rozdělení. Například z hustoty (10).dostaneme hustotu pravděpodobnosti komponent za předpokladu, Že na- bývá pevné hodnoty x^°\t vhodným normováním: fÍ2' ■»ín t3C2'**-»^ii ji - xi r ^ /Iío)» ~> íl5) rji 4X i ? kde fji je marginální hust.ota (14). Normovači faktor vychází přímo z definice podmíněné pravděpodobnosti (1.4). Nezávislost náhodných proměnných Má-li náhodný vektor £ s komponentami fjyWfšf distribuční funkci, které je součinem marginálních distribučních funkcí, .^^'"••y = ^^'•••W' C16) označujeme náhodné proměnné f^tr'tfn 3ato nezávislém Smysl tohoto pojmenování je stejný jako v případě nezávislosti náhodných jevů (§1, vzorec (1.5)) - pravděpodobnosti nebo hustoty jedné z proměnných nezáleží vůbec na ostatních. Hodnoty podmíněných pravděpodobností nebo hustot (jako např, ve vztahu (15)) jsou tytéž jako bez podmínek, což ee dá stručně vyjádřit formulí (16)> i \. Výsledky měření - hodnoty náhodných proměnných Měřením získáváme ve velké větSiné případů soubory Čísel. Náhodné - 13 - vlivy působící v procesu měření vedou k tomu, Se je více možných výsledků. O tom se můžeme přesvědčit pouze opakováním celého měření v nezměněných podmínkách. Zkušenost nás učí, že ee relativní četnosti možných výsledků 8 rostoucím počtem opakování blíží k pevným hodnotám r pravděpodobnostem. V opačném případě usuzujeme na změnu podmínek měření. Naměřené čísla jsou hodnotami náhodných proměnných. Cílem je ovšem zjištění vlastností měřeného objektu, které jsou reprezentovány "pevnými hodnotami parametrů. Tyto parametry, spolu s náhodnými vlivy, formují náhodné proměnné popisující výsledky měření". Vhodným zpracováním dat se snažíme'potlačit vliv náhody a "určit", nebo lépe-"odhadnout"t hledané* parametry. Statistický termín odhad je lepší, proVože hodnoty parametrů vypočtené z naměřených dat tvoří opět náhodné proměnné a jejich souvislost se ekutečnýml parametry můžeme vyjádřit pouze pomocí pojmu pravděpodobnosti. '■. Na závěr ukážeme výsledky, dvou typických měření. Přiklad měřeni časového intervalu .\ K měření byl vybrán časový interval známé délky - totiž doba, za kterou proběhne vteřinová ručička hodin dva vteřinové dílky ciferníku. Při průchodu ručky výchozí značkou byly "ručně" .spuštěny, a po průběhu dvou dílků opět ručně zastaveny, digitální hodiny, které počítaly intér-".' valy délky asi 0.58 ms (milisekundy). Počet tiků digitálních hodin byl tis) 2. 28 - 2.80 - 1.88 - 50 100 150 číslo měření 200 Obr. 1. Výsledky opakovaného měření času. - H - zaregistrován a měření opakováno celkem 200-krét. Vynecháme diskusi o možných systematických chybách, která by mohla být velmi obsáhlé i v tomto jednoduchém případě. Výsledky jednotlivých měření se ovšem liší od správné hodnoty t0=2s, především proto, Že se málokdy podaří spustit a zastavit hodiny při průchodu ručky přesně nad značkou ciferníku. Soubor výsledků je graficky znázorněn v obr. 1. Registrované údaje jsou hodnotami diskrétní náhodná proměnné (pouze celočíselné násobky délky tiku digitálních hodin. V § 11 se k tomuto příkladu vrátíme a uvidíme, že toto diskrétní rozdělení může být velmi dobře aproximováno jedním známým rozdělením spojitým; ukážeme, jak je třeba získané data zpracovat a jak interpretovat výsledky. Hrubou představu o hustotě pravděpodobnosti příslušné nehodné proměnné poskytuje histogram na obr. 2» Výškou sloupců jsou tam znázorněny počty naměřených hodnot ve dvaceti .stejně dlouhých intervalech mezi největším s nejmenším údajem. Četnosti v jednotlivých sloupcích histogramu jsou náhodné veličiny, proto dochází k výrazným odchylkám od předpokládaného plavného průběhu hustoty pravděpodobnosti. V tomto měření se uplatňují náhodné vlivy prostřednictvím nekontrolovatelných lidských reakcí. Zřejmě by nebylo příliš obtížné spouštění a zastavování hodin zautomatizovat a tím měření zpřesnit. Pro následující příklad bylo zvoleno měření, do jehož průběhu člověk nezasahuje. Přiklad měření propustnosti spektrometrem Propustnost (podíl intenzit prošlého a dopadajícího světla) zkoumaného vzorku se měří spektrometrem. Ze světla vycházejícího ze zdroje se vybírá určité pásmo vlnových délek. Světelný paprsek je rozdělen na dvě části, z nichž jedna prochází vzorkem a druhá jde mimo něj. Obě části jsou registrovány detektorem, který převádí intenzity na elektrické napětí. V elektrických obvodech jsou tyto signály zpracovány tak, že údajem na výstupu je propustnost vzorku. Činnost moderních spektrometrů je řízena počítačem a měření, včetně zápisu výsledků, může.probíhat zcela automaticky. Přesto jsou výsledky opět zatíženy náhodnými chybami. Pro naši ukázku J6me vybrali data pořízená na kvalitním infračerveném spektrometru, na kterém byla pevně nastavena vlnové délka světla a počítač registroval v konstantních časových intervalech výstupní signál* Tisíc zapsaných hodnot je znázorněno v obr. 3 ve formě histogramu. Aby vynikl diskrétní charakter výsledků, zachovali jsme signál ve tvaru celých čísel - tak, jak vychází z analogově-digitálního převodníku v přístroji. Propustnost dostaneme násobením tohoto údaje konstantou, danou nastavením aparatury; nesprávné nastavení vede k systematickým chybám. Kolísání signálu, označované jako šum, je způsobeno především náhodnými procesy ve zdroji světla a v detektoru. V dobrém přístroji jsou tyto prvky vybrány tak, aby poměr signól/šum byl co největší. Zlepšení dosažitelné s přijatelnou námahou obvykle není možné. Návod k optimálnímu zpracování dat, - 15 - U 68 i. 80 2-00 .2. Histogram sestavení z dat v obr, 1- 2-20 tís J 100 200 300 400 signál Obr. 3. Histogram výsledků lOOOx opakovaného mSreni'na infračerveném spektrometru. které jsou k dispozici, poskytuji statistické metody. Analýzou rozdělení nehodné veličiny z tohoto přikladu se budeme zabývat v §§ 20 a 21; ukážeme, že je stejného typu jako v hořejším příkladě ručního měření času. 3« Vlastnosti nehodných proměnných Náhodná proměnná je úplně zadaná svojí distribuční funkcí, případně hustotou nebo diskrétní funkcí rozděleni. Velmi užitečná jsou následující číselné hodnoty, které vystihují některé podstatné vlastnosti rozdělení pravděpodobnosti. Střední hodnota náhodná veličiny ^(diskrétní, rozdělení P(y^)) a ^ (spojité, s hustotou f* (x)) je definována vztahem J co Eí?) ■ Z+iPifi), E(J) = S>xf(x}dx , . £1) jestliže tyto výrazy existují. Pro zadané funkce g(^), h(|) jsou střední hodnoty co EÍg(n)] = Hgto^Pto), Ejhíp] = ^ h(x)f (x)dx. (2)' . ** ■ ■■ * i —co Je třeba si uvědomit, že střední hodnota není funkcí hodnot náhodné proměnné; symbolem E Xj) vyjadřujeme, že jde o střední hodnotu proměnné J-« Je to lineární funkcionál, z definice (2) vychází E[adl(í) + bd2(í}] = ^ŕlíjí + bE[d2(fO <3) pro libovolná čísla a,b. Střední hodnota charakterizuje polohu rozdělení. Označuje se někdy také jako matematické očekávání, expektance, střed rozděleni. Pro některá rozdělení toto číslo neexistuje, napr. pro tzv. Cau-chyovu hustotu f(x) =[Tf(l+x2)J_1 (viz §9) není integrál (1) definován. Disperze • je střední hodnota kvadrátů odchylek od střední hodnoty náhodná veličiny: . .-- D(£) = E{[y-E(£)] 2j = Z [yi-Eíg)]2 P(yi), co D(|3 = e{[x-E({)] 2} = £[x-E(J)]2 f(x)dx; (4) pokud existuje, charakterizuje Šířku rozdělení. Velmi často se pro ni užívá symbolu 2, hodnotě 6" se pak říká střední kvadratické odchylka. Medián a moda jsou dalšími charakteristikami polohy rozdělení. Medián x^yg je takové hodnota náhodné proměnné | s distribuční funkcí F(x), pro kterou F(x1/2) « P(xfc - E (6) momenty vzhledem ke střední hodnotě (c =■ E(£)) jsou centrální; ftc = - E(f)]k}. (7) • Střední hodnota je tedy prvním algebraickým momentem (Ý^),-disperze druhým centrálním momentem (^>)« Asymetrie a exce3 (" Asymetrie ^ je definována jako M =V/^/^> (8) Frp symetrické rozdělení je ^ a tedy i asymetrie nulová. Pro nesymetrické; rozdělení je vhodnou mírou odchylky od symetrie. Exces v je zvolen tak, aby pro normální rozdělení (§4) byl nulový. Umožňuje rychlé posouzení'odlišnosti zadaného rozdělení od normálního (je mírou "Špi-rcatosti" ,,.j^>0 má rozdělení ostřejší, y2-CO rozdělení plošší než normální se stejnou disperzí). Momenty náhodného vektoru Pojmy střední hodnoty a momentů, zavedené ve vztazích (l)t(2),(6) a (7), se dají snadno zobecnit pro vícerozměrnou náhodnou proměnnou. Kvůli jednoduchosti zápisu se omezíme na případ náhodného vektoru ^ se dvěma komponentami (|^, ^2)» k"tery nabývá-hodnot (x^Xg) s hustotou f (x^,^)'. Střední hodnota funkce h (|lfř2) je definována formulí analogickou k (2): co ^^l*^'] = ^ htxl»x2)f(xl*:iC2)dxiax2-; (10) Zvolíme-li za funkci h mocniny ^ a £2, dostaneme z posledního vztahu momenty vektoru J_. Vypíšeme explicitně nejdůjiežitějŠÍ z nich. Dvojice prvních algebraických momentů oo co : EC^) = fCx^x^) d3idx2» E(^2) = \\ "x2 fíx^x^) dxj^dxj Ul> bývá značena jako střed rozdělení vektoruJ^. Dále jsou to druhé centrální momenty - 18 - což jsou disperze komponent JĽ,, |2 (disperze marginálních rozděleni ze vztahů (2.14)). Konečně, smíšený druhý centrální moment D = ^^Bá^fžflJ " E(flÍ2) - SE($2) (13) se značí také jako kovariace j£ a nebo korelační moment. Všimneme si, Že z definicí (12) a (13) vychází éf = Díjj^jj). Korelační koeficient Koeficient korelace ^(ji*^ mez* \\ a f2 def,^nov^n vztahem ťK'Í2> - D(fi42W^}i>i> -M&y/ie&h (14) snadno se ověří, Že může nabývat pouze hodnot z intervalu ^-1,1^. Jsou-li j1§ \2 nezávislé (viz §2), je Eíf^* * E(JX>E<|2> a podle (13) vyjde Dí^,^) = O, tedy i ^ í f if ř2J = °* Je-li korelační koeficient nenulový, nemohou být příslušné náhodné proměnné nezávislé. Obrácené tvrzení však neplatí: existují závislé náhodné proměnná, které mají nulový korelační koeficient. Je-li o( ^2) = O, říkáme, že&i a j2 Jsou nekorelované, což je slabší vlastnost než nezávislost. Přesio je korelační koeficient užitečnou charakteristikou; podrobněji prozkoumáme jeho význam v případě normálně rozděleného náhodného vektoru v § 6. Matice druhých momentů a korelačních koeficientů Je-li počet n komponent náhodného vektoru £ větší než 2, můžeme definovat smíšený druhý centrální moment a korelační koeficient pro-každou dvojici J^, ^.j z příslušného dvojrozměrného marginálního rozdělení (rozdělení integrované přes všechny složky kromě i-té a j-té). Čtvercovou matici s prvky, Dij ' D<íi* f j}> 1 »0=1.....n V, (15) nazýváme maticí druhých momentů, kovarianční nebo disperzní maticí, někdy také maticí chyb. V diagonále jsou disperze jednotlivých komponent!. Dii = matic® áe symetrická (Dj^ = Dj^* Čtvercová matice sestavená z korelačních koeficientů .?i5. - ?á = 1—--a C16) se označuje jako korelační matice. Je opět symetrická, v diagonále jsou jedničky (korelační koeficient každé komponenty se sebou samou je roven jedné). Užitečnými čísly jsou tzv. globální korelační koeficienty ^ pro každou komponentu Jsou to maximální hodnoty korelačního koeficientu o<^j,^), když £ probíhá všechny možné lineární kombinace všech komponent vektoru J, kromě i-té, oi tedy udává míru korelace \ i se souborem zbylých komponent. Předpokládejmef Že ke kovariační matici (15) existuje matice inverzní; její i-tý diagonální prvek' označíme (D**1)^. Pro globální - 19 - korelační koeficient vyjde jednoduchá formule ti "lÍ1 " [Dii ^iil"1 • <17> Jestliže je kovariační matice singulární (neexistuje matice inverzní), je alespoň jedna ze složek í - nějakou lineární kombinací ostatních, tedy ú-plně korelovaná s touto lineární kombinací (^=1). Lineární funkce náhodných proměnných j: , Lineární kombinace a^^-t-.. .+an^n náhodných proměnných fif-»^n (alf'-.*,an jsou čísla) tvoří náhodnou proměnnou, pro niž snadno najdeme střední hodnotu a disperzi: EÍ^Z^fi1 " j^ai.E(fiJ» í^8a) i=l i=l Ďfeiii)=^sv^cíi4á)=£:*l ^!i)+2£k*iv(íi'f3}' Cl8b) 1=1 l-l 3-1 1*1 1*1 , Podobně pro smíšený druhý centrální seffieat dvou liaeéraíeh kombinací vyjde vyjádření n , ri ; n__n (18c) i=i í_1 i«i 3*1 ^ Disperze jsou kvadratickou formou koeficientů roskladu a^. Pokud jsou ^ vzájemně nekorelované ("t• J*pro všechna i^j)s zůstane v (18b) jen . první Sien na pravá straně: i=l i*l • nalezení hustoty lineární kombinace s hustoty f|_(s^f ...,xn) je trochu složitější. Elementární úvahou nsbo využitím vztahu (2*5) zjistí- ' me, Že hustota konstantního náaotofcu nehodná proměnné j je násobkem hustoty f j (x) í g^íax) ±"Tfj(^)' C20) Celý problém se tedy redukuje v pod stati na určení hustoty součtu uvou -proměnných ^«Jj+f2* DistribuSní funkce ^ je- Jsou-li jlt j-2 nezávislé, je'f^, J2íxl»3t:2,:s:fíl(xl>fÍ2t'x2> 1 ^bstituoí v (21) dostaneme °g y y 00 Podle vztahu (2,9) áe tedy hustota součtu dvou nezávislých nehodných proměnných dona konvolucf oo Vy> = íff2íu>f.řlCy"u,dl1' ! (23) Podíl nezávislých náhodných proměnných Předpokládejme, 2e -|2 ^80U nezév*fllé a hustoty £|gta^l.a fjgCXg), resp. distribuční funkce F^ÍXj), Fj^{x^)t Hustotu podílu %mf^/i^ najdeme pomocí distribuční funkce ■ ■ . ^(y)=^ Ä e> -<» -----.——! Podle vztahu (2.9) dostaneme hledanou hustotu derivováním: f^(y)=^ F^(y)= J3^(^X2)^2(12)01X2 ,-Jx2f|1(yx2)f^2(x2)dx2. . (25) O ,.00. : _ ■ , Přibližná formule pro střední hodnotu a disperzi nelineární funkce Střední hodnotu a disperzi funkce h(j^(..+,|n) náhodných procitaných můžeme aproximovat jednoduchými vztahy za předpokladu. Že je průběh h v okolí středních hodnot E(J1),...,E(^n) téměř lineární. V TayloroVě rozvoji * r—*r 'ôh ř ^h-'-w^Ni^*"'^ftA *W^émů^B(26) zachováme pouze uvedené dva Členy; symbol E u derivací znamená, 2e jde o hodnoty v bodě E( ,... ,E(|n). Střední hodnota druhého Členu v (26) je nulová, proto E[h(jlt..„,|n)] äí hjWk).....B(fn)]. Í27) Pro disperzi funkce h dostáváme »[«h.....mi- Etth-E(h>] H& p^<ÄttB<^i%y' - n n tiM-\ 14 jxři-fd'-" (28) í=i E^fj !E - 21 - To je samozřejmé vztah (18b), jen na místě koeficientů a^ stojí derivace **h/fíl' V rozvoji (26) jsme zachovali- lineární kombinaci f^ a aditivní konstanty, které disperzi neovlivní. Úplně stejně odvodíme smíšený druhý moment dvou funkcí ntJ^» • t/^ a * * * i DXh^J^ffh-Eíh^fg-Eťg)]}^ £ ITÍ£- ^-1 D(fi'íáK • (29) i=l j=l aľi E aJj 1 E Kvalita aproximací (27)-(29) záleží na tom, jak dobré je lineární přiblížení funkčních" průběhů pomocí dvou členů Taylorova rozvoje v takové oblasti argumentů, která podstatně přispívá k disperzi. Velikost táto oblasti záleží na tom, jak Široká jsou rozdělení proměnných íx****'ín' tedy hlavně na jejich disperzích. Aproximace se v zásadě zlepšují při -. zmenšování driihých momentů ' * " Jsou-li |j nekorelované, dostaneme z (28) a (29) jednodušfií vztahy D(^ll(|r| )hH) . D(h,g)«2:|f M *rfc>, (30) i=l\BTí!E ' 1......,> V i=l Ji E ý i E ' První z relací (30), přepsané pro střední kvadratické odchylky ť?h=^D{ta), ^i^y^^ti * ae také (Gaussův) zákon pro přenos chyb: Charakteristické;funkce Fourierova transformace hustoty nebo diskrétní funkce rozdělení ee nazývá charakteristickou funkcí náhodné proměnné. Je to komplexní funkce reálné proměnné ti ^t)=E[exp(it^)] = J exp(itx)f^(s)dx C32) pro spojitou proměnnou | s hustotou fý (x). Charakteristické funkce úplne popisuje náhodná proměnná; hustota je dána obrácenou transformací co f,(x)= JL \X4(t)exp(-ixt)at. • (33) Jsou-li a,b konstanty, platí Xaj+b (t)=E|exp[it(aJ+b)]|=exp(itb)Xj(at). (34) Pro nezávislé ^f |2 dostaneme charakteristickou funkci součtu 3**° součin | ^1+|2ít)-E{exp[iť(J1*{2)]] ^[expíit^^.'B^dt^)] -X^íO^U). (35) To je jeden z důvodů velké užitečnosti charakteristické funkce (namísto konvoluce hustot (23) méme jednoduchý součin charakteristických funkcí). Znalost Xj(t) je užitečná i pro nalezení momentů (6) ze zápisu exponenty pomocí mocninné řady: J k=o k=o K! k=o fc! Komenty vk jsou, až ňa faktor i^/kl, rovny koeficientům u členů tk v rozkladu X(t) v mocninnou řadu. 4. Normální rozdělení Spojitá náhodná proměnná, které nabývá libovolných reálných hodnot x s hustotou pravděpodobnosti f(x) = 1 exp[ . ZfŽŠŤ \ 262 J (1) iné tzv. normální, nebo Gaussovo-Laplaceovo, rozdělení. Kvůli stručnosti vyjadřování přestaneme v daláím textu odliSovat označení pro náhodnou proměnnou a její hodnoty, používané důsledně v §§ 2 a 3; budeme například říkat, že (1) je hustotou proměnné x. Rozdělení (1) je zadáno dvěma reálnými parametry} i může být libovolná ,€T musí být kladné. £tje střední hodnota, ť> střední kvadratická odchylka (G2 disperze): E(x)=rS D(x)=62. (2) Normální rozdělení je symetrické vzhledem ke střední hodnotě -^t, která je zároveň mediánem i jedinou módou. Charakteristická funkce: X(t)=exp(i^t - t262/2). (3) Centrální momenty (3*7) lichého řádu jsou nulové, pro sudý řád vychází _ (2k)i -2k rak k, " b , k»i. (4) 2K(k)! Asymetrie (3.8) i exces (3*9) jsou nulové: fi~ #2^°* Pro hustotu (1) se užívá značení N^typ2); její charakteristický "zvo.-nový" průběh je pro tři různé disperze 62 nakreslen v obr. 4. Distribuční funkce je F(x>a$<^rPJt kde <£(z)= -|=r J exp(-^)dt. ' ' (5) Funkci ^(z) se říká integrál, pravděpodobnosti nebo funkce chyb. F(x) pro tři různé disperze ie nakreslena v obr. 5. Pomocí distribuční funkce (§2) můžeme vyjádřit pravděpodobnost, že hodnota x padne do zadaného intervalu: To je jeden z důvodů velká užitečnosti charakteristické funkce (namísto konvoluce hustot (23) máme jednoduchý součin charakteristických funkci). Znalost Xj(t) je užitečná i pro nalezení momentů (6) ze zápisu exponenty pomocí mocninné řady: oo v 00 ,00. k=o ' k=o k=o V v- Momenty jsou, až ňa :ffaktor i /kl, rovny koeficientům u členů t v rozkladu X(t) v mocninnou řádu. 4. Normální rozdělení Spojitá náhodná proměnné, která nabývá libovolných reálných hodnot x s hustotou pravděpodobnosti Sifšiř L 26 J (D iné tzv. normální, nebo Gaussovo-Laplaceovo, rozdělení. Kvůli stručnosti vyjadřování přestaneme v dalším textu odlišovat označení pro náhodnou proměnnou a její hodnoty, používané důsledně v §§ 2 a 3; budeme například říkat, Že (1) je hustotou proměnné x. ». ---:- ' Rozdělení (1) je zadáno dvěma reálnými parametry j p* \ může být libovolné , €T musí být kladné. £1 je střední hodnota, S střední kvadratická odchylka (*2 disperze): E(x)=^U., D(x)=62. (2) Formální rozděleni je symetrické vzhledem ke střední hodnotě ^í, která je zároveň mediánem i jedinou módou. Charakteristická funkce: X(t)=exp(i^it - t^2^). (3) Centrální momenty (3.7) lichého řádu jsou nulové, pro sudý řád vychází u - <2k)! _2k ^2k k, % 6 , k*l. (4) 2*(k)l Asymetrie (3.8) i exces (3.9) jsou nulové: v^* ^-O. . Pro hustotu (1) se užívá značení N^^); její charakteristický "zvo-1 prut funkce je ■nový* průběh je pro tři různé disperze 6 nakreslen v obr. 4. Distribuční .2 F(x)=J(^|, kde |(ž)= -j= $ exp(-£-)dt. (5) Funkci $íz.) se říká integrál pravděpodobnosti nebo funkce chyb. F(x) pro tři různé disperze je nakreslena v obr. 5. Pomocí distribuční funkce (§2) můžeme vyjádřit pravděpodobnost, že hodnota x padne do zadaného intervalu: - 23 - i Obr. 5. Distribuční, funkce normálního rozdělení s p=0 a 6 =l,4t9. - 24 - P(xfe )=F(x2}-r(x1). Vyčíslením integrálu pravděpodobnosti (5) zjistíme, že P^l-G**ÍX<£l+G>«Q.683, • P(^-2Tťxí^+26,)»0.954. (6) Střední kvadratická odchylce 6 se v případe' normálního rozdělení říká také standardní odchylka. Intervaly (t±.G a (í±2G s pravděpodobnostním obsahem (6) se pak označují. jako intervaly s jednou a dvěma standardními.odchylkami . Velmi potřebné funkce- chyb (5) byla- mnohokrát tabelovéna (v razn^cfe f modifikacích). Užitečné jsou různé aproximace, které umožňují vypočítat dostatečně přesné hodnoty s minimální námahou, např. $(z)»l - ex?Szl /2?.t (0.3193815-0.3565638t+1.781478t2-l.821256t3+ +1.330274t4), t-l/(l+0.23164192ÍO pro ss»0, - i]. .(7) f (z)=l-|(|z|) pro z< Oj • - chyba této aproximace je pro libovolné z menäí než 10*"^. Náhodná proměnná (x-^O/ET má tzv. standardní normální.rozdělení N(0,1) se střední-hodnotou 0 a disperzi 1; její distribuční funkcí je integrál pravděpodobnosti , t Normální rozdělení má při zpracování výsledků měření podstatnou důležitost. Předevaim v mnoha situacích velmi dobře vystihuje rozložení naměřených hodnot."Je5tS důležitější je fakt, že i pro data s výrazně odlišným rozdělením mají statistické odhady z nich spočtené rozdělení zhruba normální; tuto souvislost vystihuje tzv. centrální limitní věta (§5). Navíc je normální rozdělení limitním případem řady důležitých diskrétních-i spojitých modelových rozdělení (§9). Pro nezávislé normálně rozdělené veličiny x^ vychází následující "důležité výsledky: a) Libovolná lineární kombinace aixi+* • •+anxH. ma ppét normální rozdělení-r O tom je možné se přesvědčit přímým výpočtem konvaluce (3*23) nebo mnohem lépe pomocí vlastnosti (3.35) charakteristických funkcí. Střední hodnota p. a disperze 6 2 musí podle (3*18a) a (3.19) být ŕ" alŕ*l+-"+an0 platí lim P(|$ - p|<&)= 1 • ■ Cl) Vyjádřeno slovy: at zvolíme £>0 jakkoli malé, s pravděpodobností libovolně blízkou k jedné jsou při dostatečně velkém počtu pokusů odchylky poměrných četností Í4/N od hodnoty p menší než & . Formuli (1) se říká (slabý) zákon velkých čísel. Tvrzení P (lim JL« p) * 1 (2) je silnější (z (2) plyne (1), ale ne naopak); objevil je Borel a říká se mu silný zákon velkých Čísel. Pro přívržence statistické definice pravděpodobnosti (§1) je zákon velkých Čísel tautologií, protože pravděpodobnost určují právě z relativních četností při opakování pokusu. Pro zastánce názoru, že se pravděpodobnosti dají (alespoň někdy) vypočíst ze struktury jevů, je předpp-věd" četností (ftáikoulogické výstavby teorie a věty o konvergenci posloupnosti M/řť^podstatnými výsledky. Slabý a silný zákon vyjadřují dva různé typy konvergence hodnot poměrných četností: tzv. konvergenci podle pravděpodobnosti, popsanou vztahem (1) a konvergenci téměř jistě (2))« Jako zákon velkých čísel se kromě (1) a (2) označují také následující věty o konvergenci posloupnosti aritmetických průměrů náhodných proměnných. Jsou-li ^i*^***' Mez^v^s^-^ náhodné proměnné se stejnou střední hodnotou £L a disperzemi D(x^)jDÍXg),... takovými, žé lim JL y~ D(x< )=0, pak lim pf|4r f" x--J K><* Ň2 i=l N i=l pro libovolné £>0. To je slabý zákon velkých čísel - posloupnost průměrů konverguje podle pravděpodobnosti ke střední hodnotě. Silný zákon tvrdí, že pro náhodné proměnné, jejichž disperze splňují podmínku -i=i 1 . konverguje průměr ke střední hodnotě téměř jistě: - 26 - P f Hm <£-ZL *i> *A~ Í, (5) U-*<» i=i J Obš vety í3) a (5) se dají zobecnit pro případ posloupnosti proměnných s různými středními hodnotami Eíx^), E(x2í,.«. ř Jejich aritmeticky průměr konverguje k limitě průměru středních hodnot £ZE(x^)J/N. Centrální limitní věta udává, jaké je v limitě rozdělení aritmetického průměru nezávislých náhodných proměnných x-^Xg,..., reteré mají stejnou distribuční funkci se střední hodnotou p a disperzí 6"2..Podle (3.18a) a (3.19) je střední hodnota průměru xN=(x1+.. ,+xK)/N rovna Eťx^J^Uí a jeho disperze Dtxj^CČ/N; hustotu pravděpodobnosti x^ dostaneme z (3.23) komplikovaným způsobem, totiž N-l-krát opakovanou konvolucí. S pomocí vlastnosti (3.35) charakteristické funkce vsak snadno zjistíme, že charakteristická funkce Xíx^) se pro N*°o blíží k charakteristické funkci (4,3) normálního rozdělení. Hustota průměru je tedy f(í-s> -se, -i . J f^)2"L • í6> íJ V21Ť6VN L2S^/-/5r J rozdělení sčítanců Xi může být jakékoliv, stačí když má konečnou disper- 2 ... ^ zi € . To je tzv. ^indbergův-Lávyův teorém, nebo jedná z variant centrální limitní věty. Jiná varianta platí pro posloupnost nezávielých náhodných proměnných x^;X?)t4. se středními hodnotami ^c.^, »■ * * a disperzemi 2 2 6"1f ^2'*"» které nemusí mít stejnou distribuční funkci. Rozdělení aritmetického průměru je v limitě N-»°o opět normální; veličina N N /"H _ Z (nv zi ^iV-í/ir^i (?) i=l i=l * i=l má asymptoticky rozdělení N(C,1). K platnosti tohoto tvrzení stačí, aby střední hodnotya disperze ~ €T^ existovaly a nerostly příliš rychle s rostoucím i. Postačující je například splnění Ljapunovový podmínky: existuje takové 8>0( ře E(xr^i)2+al 7 C flG?)2+a = 0. ■ (8) i=l Přiklad: součet rovnoměrně rozdělených náhodných čiáel Konvergenci součtu nezávislých náhodných proměnných k normálnímu rozdělení budeme ilustrovat na příkladu rovnoměrně rozdělených (§9) veličin x^ s hustotou f(xi) * i, xie. Hustota aritmetického průměru xjj ■ sN/N, kde sN ■ + . řit analyticky; je to po částech polynom stupně N-l; ——- £ <-"i<í» (N-l)I i=0 f(FN) (9) .+Xjj, ae dá vyjód- c . • (10) — • / k k+1 \ . Ä Střední hodnotu a disperzi součtu s^ můžeme vypočíst mnohem snáze než hustotu; s pomocí (9.6) dostaneme E(sN) = NE(Xi) = N/2, D(sN) = ND(xi) = N/12. ■ (u) Srovnání hustoty součtu sN a normální hustoty se stejnou střední hodnotou a disperzí je v obr. 6. Je vidět, že konvergence k normálnímu rozdělení je velmi rychlé, veličina a^g-^ m^ prakticky" standardní normální rozdělení. T 0. 6 - 0.4 - 0.2 - 0„0 - Obr. 6. Hustota pravděpodobnosti souč-tu N nezávislých rovnoměrně rozdělených náhodných proměnných (plná čára), normální hustota se stejnou střední hodnotou a disperzí (podle vztahu (11), čárkovaná čára). 6, Vícerozměrné normální rozdělení - 28 -1 Zobecnění normálního rozdělení (4.1) na případ n-rozměmého náhodného vektoru vychází z požadavku, aby hustota byla úměrná exponenciální funkci kvadratické formy jednotlivých složek: f(xv...,xn) - c.exp [~tE II^j^i-^i^^á'^dM ' (1) L i=l j=l Konečný tvar této hustoty odvodíme podrobněji, protože se přitom ukáže řada užitečných souvislostí. Kvůli přehlednosti zápisu zavedeme následující konvence: Čtvercovou matici budeme značit velkým písmenem a podloženou vlnovkou, sloupcové vektory podtržením, transpozici libovolné matice horním indexem T (například sloupcový vektor se složkami jako A, řád-kový vektory - ... ffi^)) • Argument exponenty v (1) tedy stručně za- píšeme jako -~ (2-^T A (x-M), ■ (2) když matice A má prvky (A)j . = a... Hořejší výraz je skalár, protože sou- čin matice A se sloupcovým vektorem x-^f je sloupcový vektor, ze kterého vyjde násobením řádkovým vektorem (x-^u.) skalární hodnota dvojnásobné sumy v (1). Aby funkce typu (1) měla vlastnosti hustoty, musí být matice -A symetrická a pozitivně definitní. Existuje pro ni rozklad = I, . Jj a regulérní maticí (jinými slovy, matici'A, dostaneme podobnostní transformací z jednotkové matice I: A = LTIL = LTL). Lineární transformací hodnot náhodného vektoru jx_ . y = L(x -£) (3) ' dostaneme (2) ve tvaru součtu kvadrátů - JL (x-/0T LTL(x-A)" = yTy = -L (y2+.. .+y2). (4) g — *— f*r r*r ~- £—. ^ — — ^ i n (Transpozice součinu matic je součinem transponovaných faktorů v opačném pořadí: (x-£)T £l(x-^iu)3T = ýT-) Ny11* můžeme snadno spočíst hodnotu konstanty c v (1) z normovači podmínky pro hustotu: oo oo í f(x1,...,xTj.)dx1...dxn= ^ ...^ c-exp (~|yTy> [det (ij"1^... dy^l. -°o -oo K (5) V posledním vztahu vystupuje jakobián transformace (-3): dy,...dy = = det(L)dx, ...dx . Protože $ exp(-t2/ádt= h'if a déle det (A)=det(LT) . . det(L) ={det(L)J2, dostáváme z (5) pro konstantu c vztah ° =ÍV^T)n . " Ví2TT)n det (A-l), ' (6J Je třeba si všimnout faktu, že _y ze vztahu (3) je náhodným vektorem s ne závislými komponentami, které mají standardní normální rozdělení (nulové střední hodnoty, jednotkové disperze a nulové korelační koeficienty). Zo becněním postupu z § 2 pro určení hustoty funkce náhodné proměnné na pří pad vektoru totiž zjistíme, že vztah (2.5) zůstane zachován, jen na místě |h\x)[ se objeví jakobián transformace. Z hustoty (1) tedy dostaneme s využitím (6) hustotu vektoru y ; f(x) 1 i i expí--yTy) = I l — n 2 y* i=i wšr . 2 (7) ve tvaru součinu standardních normálních hustot jednotlivých komponent. Vektor středních hodnot y je nulový, což zapíšeme symbolicky jako E(y)=0. Podle (3) můžeme do tohoto vztahu dosadit ^y=I.{x-^:); protože podle (3.18a) je E lineární operátor a L je regulární, dostaneme odtud Eíx-^tt)^ a tedy střední hodnoty vektoru x: E|x) =£ . v (3) Matice druhých momentů vektoru y je jednotková, symbolicky E(yyT)=I; součin sloupcového.a řádkového vektoru yy tvoří čtvercovou matici nxn a funkcionál E působí na každý její prvek zvláší. Dosazením za y z (3) a využitím linearity £ dostaneme V. : neboli pro matici druhých momentů vektoru x vztah V = Er(x-/0(x-/0T]= iT1^)"1 = (LTL)_1 = A"1. (9) Matice A koeficientů kvadratické formy (2) je tedy rovna inverzní kova-riační matici . Kdo nevěří maticovým zápisům, může se pokusit vypočíst prvky D(xí(x-) matice D jednotlivě. Kovariance vyjádříme pomocí korelaČ-nich koeficientů ^ a disperzí t> jako D(x^,x^) = ^íj^í^j (viz (3.16)); dostaneme výhodný tvar kovariační matice ■6* (10) Libovolné n-rozměrné normální'rozdělení může být zadáno n-ticí středních hodnot £t*& n(n+l)/2 nezávislými prvky symetrické matice - buä A, nebo T)t Vyjádření hustoty (1) s normalizační konstantou (6) pomocí matice M i" ' - 30 - f(x) *= . 1 =r exp I - -|"(x-^)TD 1 (x-^tt) I , (11) V(2TOndet(D) L "J Veličina Í ~ (í"Č)T£-lí5"tf = íí"C)Tr6íí7a) (12) se nazývá kovariační formou náhodného vektoru s. Je to jednorozměrné ná-hodná proměnné s rozdělením X s n stupni volnosti ($ 8), neboí se dá napsat jako součet kvadrátů n-tice nezávislých proměnných se standardním normálním rozdělením.y= y_y. Hustota (11) je konstantní na plochách ^= konat, a pravděpodobnostní obsah těchto elipsoidů (pravděpodobnost, . že x padne dovnitř elipsoidu) je dána distribuční funkcí?^. Z pozoruhodných vlastností rozdělení (11) uvedeme dvě: a) Libovolné projekce na prostor menší dimenze (marginální rozdělení,§2) je opět normální s maticí druhých momentů sestavenou z prvků matice (10) odpovídajících zbylým proměnným. Například marginální rozdělení každé komponenty je f(Xi) » N(^if 6^). (13) b) Libovolný řez (podmíněné rozdělení, §2) je opět normální. Řez rovinou j Xj_=x^0^ , t.j. rozdělení s konstantní hodnotou xí°^složky x^, má matici druhých momentů D_ ,, kterou dostaneme inverzí matice A _, kova- r-n-1 wn-1' riační formy zbylých proměnných. Dvojrozměrné normální rozděleni Pro dvojrozměrné (n=2) rozdělení můžeme snadno vyjádřit explicitně prvky matice Dj^J hustota (11), zapsaná pomocí-středních hodnoty, standardních odchylek ^»6^ a korelačního koeficientu^má tvar f(x1,x2) = ——j==exp (14) Můžeme si ji představit názorně jako zvonovitou plochu nad rovinou x^,x_, nebo při pohledu shora znázornit soustavu vrstevnic - čar s konstantní funkční hodnotou. Vrstevnicemi jsou elipsy Protože kovariační forma na levé straně (15) má známé rozdělení {% se dvěma stupni volnosti), můžeme vypočíst pravděpodobnost, Že dvojice x^,x2 leží uvnitř elipsy (15): - 31 - P = 00 ; Fv2 ?e příslušná distribuční funkce, V obrázku 7 je nakresleno několik *2 elips s různými pravděpodobnostními obsahy P=0.99, 0.954, 0.683, 0.5, 0.2, pro které podle tabulky v dodatku Dl vychází hodnoty A po řadě 9.21, 6.158, 2.298, 1.386, 0.446; korelační koeficient je o = -3/4. Z hustoty (14) odvodíme podmíněné rozdělení x^ za předpokladu, že x2 nabývá pevné hodnoty (viz (2.15)): g(x1)=f(x1í x2) = (-11! )6^ L ^ V% ' *J J (16) Je to normální rozdělení se střední hodnotou a disperzí (17) : V tomto místě máme dobrou příležitost ilustrovat smysl pojmů závislost a korelace náhodných proměnných. Normálně rozdělené proměnné jsou • nezávislé práve tehdy, když jsou nekorelované; je vidět, že hustota (14) 2 2 je pro<3= 0 součinem hustot NÍ^, 6^£) a Ní^,^). Jinými slovy, rozdělení každé proměnné je nezávislé na tom, jakou hodnotu nabývá druhá z nich. Obecně (pro jiná rozdělení) je ovšem nekorelovanost slabší než nezávislost (§3). Je-li korelační koeficient různý od nuly, záleží podle (17) rozdělení x-^ na tom, jaké hodnoty nabývá Xgj při [o}-?! se zužuje kolem střední hodnoty závislé na x2. V limitním případě úplné korelace (^>=1) nabývají náhodné proměnné x-^x- hodnot, které spolu souvisí vztahem <*l-fr.)/5l = (x2-^2)/62 (18) Míru závislosti o obou proměnných můžeme znázornit ještě jinak. V obrázku 8 jsou nakresleny'konstantní hustoty, které mají stejný pravděpodobnostní obsah P=0.954 a liší se hodnotou korelačního koeficientu. S rostoucím o Obr. 7. Elipsy (15) normálního rozdělení -s korelačním koeficientem o = -3/4. Pravděpodobnostní obsah je, po řadě od největší k . nejmenší, roven 0.99, 0.954, 0.683, 0.5, 0.2. ^2-3%-- - 32 - Obr. 8. Elipsy s pravděpodobnostním obsahem 0.954 a různými korelačními koeficienty ťj = 0 (kruh), 0.5» 0.9, 0.95, 0.99 (nejužSí elipsa!. se oblast, do které bod x^, x2 padne s velkou pravděpodobností, zužuje. Pro 0= 1 zdegeneruje elipsa v úsečku a x-^ je lineární funkcí x2 podle vztahu (18). / Pravděpodobnostní obsah eliptických oblastí počítáme jednoduše pomocí \ p ■ distribuční funkce % - rozdělení. Užitečným údajem je pravděpodobnostní obsah obdélníků xi^^^_i^*^i+k6iV) :x2^^tl2~k^'í*2+i^2'? pro za<äané násobky, k standardních odchylek; k jeho vyčíslení je třeba integrovat funkci chýb (4.5): &1 +k61 P ■ S +ke; dx-i -ke; L tem. f(x1,x2) -£-)dt. (19) Závislost P na korelačním koeficientu pro několik hodnot k $e nakreslena v obr. 9. 7. Binomické a Poissonovo rozdělení Binomická rozděleni.. Diskrétní náhodná proměnná, která nabývá celé nezáporné hodnoty r s pravděpodobností • " -"* P(r) = (")pr(l-p)N~r , r= 0,1,...,B, - (1) kde H je celé kladné, p reálné, O^p^l, má tzv. binomické rozdělení. Pravděpodobnosti (1) jsou členy binomického rozvoje tpn>N= t ' N' Pr og-r (a* r=0 r!(N-r)! - | s %= 1-p. Střední hodnota, disperze, asymetrie a exces: E(r)=Np, D(r)=Ng(l-p),ri^-2P , vy ^jg^, ^ 01 VNp(l-p) fl 2 Kp(l-p) (3) Proměnná s binomickým rozdělením popisuje výsledky opakovaných poku-bů a náhodným jevem, který má jen dva možné výsledky. Jeden z nich 1.0 0.8 0. S 0.4 i-1-r - 33 - 2.5 1.5 t-1-1-r—-1-r I I I 0.2 k=0.5 0.0 - J-1-1_i_i_i_i_ ■ ' ' 0.0 0.2 0.4 0.6 0.8 1.0 Obr. 9. Pravděpodobnostní obsah obdélníků ^-kS^^-k^ dvojrozměrného normálního rozdělení v závislosti na koeficientu korelace <3. 0. 00 Obr. 10. Binomické (N=10,p=l/2, svislé úsečky) a normální rozdělení. 34 - (označíme ho úspěch) má pravděpodobnost pt druhý 1-p. Pravděpodobnost, že v N pokusech nastane r-krát úspěch, je dána formulí (1). Toto rozdělení se dá použít v mnoha situacích, vybereme-li z možných výsledku nějakou podmnožinu a považujeme ji za úspěch. Například počet událostí v jedné buňce histogramu má binomické rozdělení. ^Pro velká H se dá diskrétní funkce (1) dobře aproximovat hustotou pravděpodobnosti normálního rozdělení. V" obr. 10 je nakreslena rozdělovači funkce (1) e N=20, p=l/2 a hustota normálního rozdělení se stejnou střední hodnotou 10 a disperzí 5. Poissonovo rozděleni má náhodná proměnné, které nabývá celé nezáporná hodnoty r s pravděpodobností Pír) =£- , r=0,l,..., (4) r! kde fJ&Q je reálné číslo. Střední hodnota, disperze, asymetrie a exces: E(r)=D{r)=^i, jŕi=l/\£í, fe^r* (5) Poissonovo rozdělení dává pravděpodobnost výskytu r událostí v daném časovém intervalu, jsou-li tyto události nezávislé a vznikají e .. konstantní rychlostí. Například, z radiaktivního zdroje vylétají částice tak, že pravděpodobnost vyzáření jedné Částice za infinitezimální čas ■ ot 3e Pravděpodobnost vyzáření r částic za konečný interval délky t je dána rozdělením (4) se střední hodnotou ft=Vt. V limitě pro N-»°° a při současném zmenšováni pravděpodobnosti p takovém, Že součin ÍTp zůstává konstantní, Np=£o, dostaneme totiž z binomického rozdělení (1) ■P(r>■.«-[(;> právě Poissonovo rozdělení (4). S rostoucí střední hodnotou se dají pravděpodobnosti. (4) dobře aproximovat normální hustotou M^a,^x>) - viz. obr. 12. 8« X » Studentovo a F - rozdělení Ve statistice hrají podstatnou roli náhodné proměnné, které.jsou funkcemi normálně rozdělených náhodných veličin; ve statistické terminologii se označují jako výběrové rozdělení z normálního souboru. Uvedeme tři- nejdůležitější. X2 - rozděleni (čti chi-kvadrét) má náhodná proměnná nabývající pouze kladných re- ľ élných hodnot s hustotou 35 - 0.6 h Pír-> 0.4 0.2 h 0.0 h Obr. 11. Foissonovo rozdělení. 0. 12 h PCrO, 0.08 h 0. 04 h 0.00 h Obr. 12. Poiesonovo rozdělení (svislé úsečky) a normální rozdělení N - 36 - TW . (V2>(-2>/2 «Pf«*». 2P(n/2) n je celé kladné Číslo, tzv. počet stupňu volnosti, funkce f* je Eulerův integrál druhého druhu. Střední hodnota, disperze, asymetrie a exces: Eíx)=n, D(x)=2n, ^»2^2/n. , y2=12/n. (2) Charakteristické funkce: 9((t) = (l^itr072 . <3X Rozdělení (1) má náhodné veličina x, která je součtem kvadrátu nezávislých proměnných x^,...,*^., z nichž každá má standardní normální rozdělení N(0,1): ... 7C=X^ + . . .+x£ . (4) . 0 tom se můžeme přesvědčit s dosti velkou námahou výpočtem hustot podle (2.7) a (3.23), elegantně pomocí charakteristických funkcí. Součet dvou nezávislých proměnných s 5ř - rozdělením a n^ a n2 stupni volnosti má rozdělení (1) s nsr^+Ug. Pro velké n se (1) blíží normálnímu rozdělení N(n,2n), viz. obr. 14. Ještě rychleji se k normálnímu rozdělení blíží veličina ^x^ přičemž pro její hustotu platí g(^2x)5á.N(V2n-l , 1) pro n£30. (5) Z přibližné formule (3.27) a z (2) vyjde střední hodnota E(\ŕ2x)ís2n a disperze D(\/^x) siD(x){l/v^n)2=l» Se střední hodnotou >/2n-l je aproximace (5) lepSÍ. Studentovo t - rozděleni má náhodná proměnná nabývající reálných hodnot s hustotou f(t) » -—a-~-(6) kde n je celé kladné Číslo - počet stupňů volnosti. Práci o t-rozdělení publikoval V r. 1908 anglický statistik Gösset pod pseudonymem Student. Střední hodnota, disperze, asymetrie a exces: E(t)=0, D(t)= -^2"Pro n?2, jJ^-O, fi2S~Á~V>r0 n>4* (7) Hustotu (6) mé náhodná veličina t= .^^^ Xn (8) kde x a x jsou nezávislé, x mé standardní normální rozdělení a x rozdě-o. 'o - 37 - 0. 00 h Obr. 14. Rozdělení X2 (plná Sára) a normální rozděleni se stejnou střední hodnotou a disperzí (čárkovaná čára). - 38 - lení X s n stupni volnosti {vztah í4)). Pro rozdelení s n=l se používá názvu Cauchyovo (§9). S rostoucím n se hustota (6) přibližuje ke standard nímu normálnímu rozdělení. Obvykle se t-rozdělení nahrazuje normálním N(0,1) pro n^30. F - rozděleni je zobecněním předchozích dvou. Označuje se často také jako Fishero- 2 vo-Snedecorovo nebo oen Snedecorovo,.nebo jako rozdělení v . Hustota prav děpodobnosti je nenulová jen pro kladná hodnoty F: m/2 P(iS±El) «ll m+m f(F) = (§> -Z-F 1 2 , F>0. (9) Zde jsou m, m'celé kladná čísla - počty stupňu volností. Střední hodnota a disperze: Hustotu (9) má náhodná veličina jt*2*...**2) ~-- , íll) 1 /~2 /J? , kde xlf... ,xm,x^t.., ,5^1 jsou nezávislé normálně rozdělené-proměnné se ' 2 2 středními hodnotami nula a stejnými disperzemi 6 (F na 6 nezávisí). Je to tedy podíl (x/mj/tx'/m')' proměnných x a x1, které mají 7Í - rozdělení s m am' stupni volnosti. Pro m,m'->oo se hustota (9) blíží k normální, ale poměrně pomalu (viz obr. 16). Pro m=l se F-rozdělení redukuje ns Studen- tovo (přesněji na t ) s m stupni volnosti. Pro mmá jmenovatel v (11) normální hustotu s o střední hodnotou 1 a disperzí klesající jako 2/m'; ve- ličina mF má tedy rozdělení, které se blíží k TÍ s m stupni volnosti. Poměrně často se používá také náhodné proměnná z=-^lnF=lni/F . Její rozdělení se označuje jako Fisherovo a má proti F.výhodu v rychlejším přiblížení- k normálnímu rozdělení při zvětšování mam*. - 39 - 0.3 0.2 h 0.1 h Obr. 15. t - rozdělení s různým poetem stupňů volnosti n a limitní normální rozděleni. ._ f(x) 1.2 h 0.8 h 0.4 h 0.0 h Obr. 16. F - rozdělení s různým poetem stupňů volnosti m=m' (plná ěára) a normální rozdělení se stejnou střední hodnotou a disperzí jako má F při m*nf=50, t.j. NÍ1.04, Q.0925) (čárkovaná fiára). - 40 - 9. Daläí modelové rozdělení, souvislost některých rozdělení Řadu základních rozdělení popsaných v předchozích paragrafech doplníme několika dalšími užitečnými typy. Multinomické rozděleni má k-rozměrná diskrétní náhodná proměnná nabývající celých nezáporných hodnot r.,,..»,rj, z rozmezí 0,1,.,,,N s^pravděpodobnostmi p(ri.....V = řjTvTTřp" Pr—\k • - (i> Přitom jsou parametry p1,...,pJc nezáporná reálná Čísla taková, Že p^+..+p^~l. Střední hodnoty a disperze jsou . E(r.) - Np£ , D(r±) = Np^U-p^) , (2) smíšené druhé momenty a korelační koeficienty D(ri»rj) = _Npipj • ?ij = _VPipá/a~piííi"?3) p« i^á. Í3) Je to zobecnění binomického rozdělení na případ, kdy má pokus více než dva možné výsledky. Vztah (1) udává pravděpodobnost, že dostaneme výsledků typu i v E nezávislých pokusech, když p. je pravděpodobnost výsledku typu i v jednom pokusu. Multinomické rozdělení popisuje například četnosti v k sloupcích histogramu s celkovým počtem událostí N. Korelační koeficienty (3) jsou záporné, zvětšení počtu v jednom sloupku vede k pravděpodobnému zmenšení počtu v kterémkoliv jiném sloupku histogramu. Pro velký počet k jsou pravděpodobnosti malé; p-. Í5Í Střední hodnota, disperze, asymetrie a exces: E(x) = (a+b)/2 , D(x) = (b-a)2/12 , jr^O , ^=-1.2. (6) Charakteristická funkce: V/* i sinhCit(b-a)/2l , it(b+a) (7\ Äit) =-it(b-a') + 2 Rovnoměrné rozdělení může popisovat například chyby, vznikající zaokrouh-^gyáním čísel. - 41 - Seta - rozdelení má spojitá náhodné proměnná e hodnotami z^0,1^ s hustotou kde n,m jsou parametry (celá kladní čísla). Střední hodnota a„disperzei m+n (m+n)2(m+n+D ' asymetrie a exces: v- - 2(n-m)Vm+n+l ,r , 3(m+n-t-1)Í.2(m+n)2+mn(m+n-6j] - n r—— ' X 2 I ™" — * * IJLOJ Vmn (m+n+2) v mn(nH-n+2)(m+n+3) Toto rozdělení se uplatňuje v případech proměnných ohraničených shora i. zdola. Zvláštním případem je rovnoměrné rozdělení (m=n=l). Několik hustot typu (8) je nakresleno v obr. 17* Exponenciální rozděleni má spojitá náhodná proměnná nabývající kladných hodnot s hustotou f(x) =-~exp(-|), x>0 , (11) kde £*>0 je reálný parametr. Střední hodnota, disperze, asymetrie á exces: E(x) =(JL, D(x) v , j^=2, Jf2=6. (12) Distribuční a charakteristické funkce": E(x) = l-expí-^) , X(t) = (1-ýrt)-1. ..." {13) Typické použití je následující: předpokládejme, že události vznikají náhodně s konstantní rychlostí (počtem za jednotku času) V. Pravděpodobnost vzniku N událostí za čas t je dána Poissonovým rozdělením (§7) se střední hodnotou *01. Pravděpodobnost, že v intervalu ^ O, t> po zoru jeme_ alespoň____ jednu udalosť* podle vztahu (7.4) rovna l-P{0)=l-exp(-vt),Cast;během kterého zaregistrujeme alespoň jednu událost, je tedy náhodné proměnné s distribuční funkcí typu (13). Dvojné exponenciální (laplaceovo) rozděleni má proměnné nabývající libovolných hodnot s hustotou ■. f(x) =^exp(--A|x-/4), <14) j ?L>0, jsou reálné parametry. Střední hodnota, disperze, asymetrie a exces:" E(x)=^, D(x)=2/?t2 , f^O , y2=3 . (15' | Pro velké Ixl ubývá hustota (14) pomaleji než pro normální, ale rychleji mež pro Cauchyovo rozdělení (19). - 42 - Obr. 17. Hustoty beta-rozdělení e různými parametry n,m. T Obr. 18. Hustoty gama-rozdělení s různými hodnotami a=h, plná Séra; normální rozdělení N(l,l/16), čárkované čára. - 43 - Gama - rozdělení je zadáno hustotou f(x) = ^^j^expí-ax) >a5q> 1 (b) ( (16) kde a, b jsou reálné kladné parametry. Střední hodnota, disperze, asymetri a exces: E(x)=b/a, D(x)=b/a2, ^2/vb", ^=6/b- (17) Charakteristická funkce: X(t)=(l-it/a)~b. (18) Toto rozdělení je užitečné v případě proměnných ohraničených shora nebo . zdola. Zvláštním případem je exponenciální (b=l) a - rozdělení (a=l./2, b přirozené). Součei n nezávislých náhodných proměnných s exponenciálním rozdělením (11) má gama-rozdělenl s b=n, a=i/tt. Hodnota parametru a ovliv ňuje pouze měřítko proměnné. S rostoucími hodnotami a,b se při a=b rozdělení (16) rychle přibližuje normálnímu N(l,l/a). V obrázku 18 je nakresle no několik hustot (16); křivka s a=b=l je hustota exponenciálního rozdělení (11) se střední hodnotou £4=1. Cauchy"vo rozdělení má spojitá náhodná proměnná, nabývající libovolných reálných hodnot s hustotou a charakteristickou funkcí f(x) »"Í—V» X(t)=exp<-|t|). (19) 11 l+x^ Střední hodnota, disperze, asymetrie ani exces neexistují. Polohu rozdělení (19) může charakterizovat medián nebo móda (obojí nulové), rozptyl kolem nuly třeba pološířka v poloviční výšce (jednička). Ve fyzice se hustota (19), zapsaná ve tvaru f(x) =i—5---(20) označuje jako rozděleni Breita-Wignera. Parametry xq a T určují modu a po-lošířku. Srovnání Cauchyovy a normální hustoty je v obr. 19. Modifikace modelových rozděleni - odříznutí Jedním z nejčastějších defektů při použiti modelových rozdělení je . skutečnost, Že oblast možných výsledků měření není nikdy nekonečná. Například v § 13 předpokládáme možnost naměřit libovolnou kladnou hodnotu doby života částice; odvozujeme ji však z délky stopy, která je omezena rozměry registračního zařízení. Tento nedostatek_se dá korigovat tak, že zachováme funkční tvar hustoty f(x), ale odřízneme intervaly hodnot, které nemohou nastat. Pro rozdělení v intervalu (a,b) musíme původní f(x) normovat: ^).=iÄr. ' (21) kde jsme distribuční funkci příslušnou k hustotě f(x) označili jako F(x). Souvislost některých modelových rozdělení V obrázku 20 je schematicky vyznačena souvislost vybraných modelových rozdělení. Pro některé hodnoty parametrů, většinou v asymptotické limitě, přechází řada rozdělení y jiný typ. Centrální postavení normálního rozdělení v tomto schématu je jedním z -důvodů jeho extrémní užitečnosti. Obr. 20. Souvislost modelových rozdělení. - 45 - II. Odhad parametrů 10. Metody statistického odhadu parametrů Ve velké většině případů je cílem měření určit hodnoty neznámých veličin, které budeme označovat jako parametry. Někdy je cíl jiný, totiž popouzení správnosti jedné nebo několika hypotéz; v takové situaci sg používají statistické metody testů hypotéz, kterými (ae budeme stručně zabývá, v části III. V úloze určení hodnot parametrů z naměřených dat budeme rozlišovat dvě možnosti - přímá a nepřímé měření. V prvním příoadě je měřeným údajem přímo hodnota hledaného parametru, v druhém je souvislost měřených dat s hledanými parametry vyjádřena zadaným funkčním vztahem, tsv. modelem. Přímé měření můžeme samozřejmě chápat jako triviální ořípad měření nepřímého<- Odlišujeme je kvůli jednoduchosti, ve které vynikne podstata statistických metod. Výsledky měřeni jsou hodnotami náhodných proměnných, aí \l2 v důsledku náhodných chyb v procesu měření nebo proto, že se samotný studovaný objekt řídí pouze pravděpodobnostními zákony. Hodnota parametru odhadnutá z měření je tedy také náhodná a nejúplnější možná informace o ní je její rozdělení. Budeme co nejdůsledněji používat statistický termín odhad parametru místo běžnějšího "určení" (nebo "změření"), protože vyjadřuje tuto podstatnou okolnost. Pro označení odhadu parametru G budeme užívat A symbolu &. Z jednoho souboru naměřených dat je obvykle možné sestrojit mnoho řízných odhadů hledaného parametru. Odhad ge funkcí naměřených hodnot, která se ve statistické terminologii označuje jako "statistika" (tohoto termínu užívat nebudeme). Z různých možností je třeba vybrat nejvhodněj-ší, splňující řadu přirozených požadavků. Základní vlastností - by měla být tzv. konzistence. Metoda odhadu se označuje jako konzistentní, konvergu-jí-li odhady ke skutečné hodnotě parametru při zvětšování počtu měření. Konzistence odhadu zaručuje, že s pomocí dostatečně velkého počtu měření dokážeme "lokalizovat" neznámý parametr s libovolně velkou přesností. Kapříklad zákon velkých čísel (§5) říká, že aritmetický průměr je konzistentním odhadem střední hodnoty. Další potřebnou vlastností dobrá metody odhadu je nestrannost. Cdhad Q parametru Q je nestranný (nevychýlený), jestliže jeho střední hodnota o j-- vždy (rozumí se 'při každém počtu N r.3z-íř_r. - i^; 1 rovna & : E(8)-eo = E(©-80) = 0. (1) • -Místence a nestrannost jsou schematicky znázorněny v obr. 21. Je třeba > uvědomit, že zúžení hustoty f (ô) při zvě-Ieri -rit- réřer.í neznamená, Že konkrétní hodnota konzistentního odhade —-si blíž ke skutečné hodnotě O , zvětší se pouze pravděpodobnosx = že se to stane. - 46 - konzistentní nevychýlený konzistentní vychýlený nekonzistentní vychýlený 9. f(8)' An3 !ľW J a Obr. 21. IfastotyVravděpódobnosti odhadu e" pro různé počty N měřených údajů. ,1 Je-li 6 nevychýleným odhadem ©o, neznamená to ještě, že nevychýleným odhadem nějaké funkce h(©0) je h(©). Například, má-li © standardní normální rozdělení, tedy střední hodnotu nula, má kvadrát (©-)2 rozdělení «1 se střední hodnotou 1 (srovnej hustoty v obr. 4 a 10). Pro střední hodnotu kvadrátu dostaneme z (3*4) E(e)J + D(©), (2) odchylka od kvadrátu střední hodnoty je rovna disperzi D(©). Při zužování rozdělení konzistentního odhadu s rostoucím počtem měření se vychýle-nost odhadu h(©) zmenšuje. Uplatňuje se totiž pouze malé oblast argumentů, ve které še dá funkce h aproximovat lineárně (viz (3.27)). Efektivnost odhadu ... Výhodné jsou takové odhady, jejichž rozdělení kolem hledané hodnoty je co nejužší. Vhodnou mírou šířky rozdělení 6 je disperze D(©); k hodnocení efektivnosti používáme podíl Dmin/D(©), kůe Óe nejmenší mo2-. ná disperze mezi všemi odhady. Obvykle se daří celkem snadno najít asymptotickou efektivnost v limitě N>co(N je počet změřených údajů). Je-li D(©)=D • , označuje se © krátce.jako efektivní odhad, mxn Odhad intervalem ä oblasti hodnot Ustálenou formou udávání výsledků měření jsou intervalové odhady. Namísto jedné hodnoty © (to je tzv. bodový odhad) je odhad parametru vyjádřen intervalem (&a»95^» který se zadanou pravděpodobností P obsahuje hledanou hodnotu ©Q. To znamená, že při opakování celého měření sice budou vycházet různé intervaly, ale zhruba v nP případech z celkového počtu n bude hledané hodnota uvnitř intervalu. Pro zadané P lze najít více intervalů s touto vlastností a je třeba vybrat optimální - to je nejčastěji interval nejmenší délky(pro "nejpřesnější lokalizaci" neznámé hodnoty). - 47 - Takto vybranému intervalu se ve statistice říká konfidenční interval e pravděpodobnostním obsahem P, nebo interval spolehlivosti. , • . ~ rozdělení Intervalový odhad ^e zpravidla založen na znalosti^bodového odhadu 6. Velmi čaBtý* je případ, kdy má © normální rozdělení se známou disperzí 6; zápisem e í g: A A - rozumíme interval (8-6, e+fo), kterýma podle (4.6) pravděpodobnostní obsah P=0.683. Je to tzv. interval s jednou standardní odchylkou. Pravděpodobnostní obsah 0.663 udávaných intervalů by měl být - dodržován a v případě, že je jiný, měl by být uveden spolu r intervalem. Hodnota P=0 . 683 nemá jiné oprávnění než tradici a souvislc.-t se standardní odchylkou normálního rozdělení. Podobně interval 6^26", podle (4.6) s P=0.954, se Často u-vádí jako výsledek měření - v případě, kdy chceme standardní pravděpodobnost 0.683 zvětšit. Mezi délkou intervalu a jeho pravděpodobnostní e obsahem je třeba vybrat rozumný kompromis. Odhadujeme-1i několik parametru současně, udáváme oblast hodnot, která se zadanou pravděpodobností obsahuje hledaný bod prostoru parametrů. V následujících odstavcích se budeme hledáním takových intervalů a oblastí několikrát zabývat. Z běžných metod odhadu vybereme dvě nejdůležitějSí, které zpravidla dávají výsledky s požadovanými vlastnostmi (konzistence, efektivnost). Protože v tomto místě chceme vysvětlit podstatné myělenky metod, budeme hovořit o jednom parametru; technické detaily postupu s větším počten parametrů jsou v následujících odstavcích (zejména §§ 15-17). Metoda maximální věrohodnosti Předpokládejme, že nezávislé naměřené hodnoty y^,,.. t\t jsou náhodné čísla popsaná hustotami f(y^j6), závislými na hledaném parametru 9. Odhad je možné založit na principu maximální věrohodnoti - najít ho tak, aby s hodnotou O byla naměřená data pravděpodobnější než s jinými hodnotami O. "Hustota pravděpodobnosti N-tice nezávislých náhodných proměnných je rovna součinu jednotlivých hustot: N L(yi,...,yNle) = P^fíy.jô). (3) Při dosazení naměřených hodnot y^ je L funkcí Ô, pro kterou zavedl Pisher označení funkce věrohodnosti a použil ji k formulaci metody maximální věrohodnosti: pro hodnotu 6 mé L(6) maximum; Je nutné si uvědomit, že proměnná & není náhodná; zacházíme s ní tak, Že zkoušíme, jak velkou věrohodnost L mají její možné hodnoty a pro odhad vybíráme bod maxima, ô už ovšem je náhodnou proměnnou, protože při opakování měření vyjde jiná N-tice y^^ a tedy i jiná funkce L(e). Podmínku maxima L můžeme zapsat jako podmínku maxima lo£^"ÍtĽU ^ - 48 - (L a lnL mají extrémy ve stejných.bodech); S InL ■ YLln f(yii e>' (4) i=l Věrohodnost může mít několik maxim. Dé se ukázat, že právě jedno z nich dává konzistentní odhad a v asymptotické limitě N-^oo je to maximum absolutní. Pro konečné N je však výběr správného maxima v "patologických" případech (maxim je víc než jedno) problematický; obvykle je třeba hledat další informace o měřeném objektu. Všechny údaje potřebné k určení rozdělení odhadu 8 jsou obsaženy v hustotách f(y.1 8); zdůrazníme ještě jednou, Že funkce věrohodnosti L(e) 1 A /\ není hustotou pravděpodobnosti odhadu 0. Prakticky se hustota 0 dá najít v některých jednoduchých a přitom důležitých případech. V následujících odstavcích uvidíme, že odhady mají typicky rozdělení normální nebo blízké k normálnímu. Obecně je hledání hustot odhadů značně obtížné, funkční zá- A vislost 0 na měřených datech y^ je dána pouze implicitně - podmínkou maxima věrohodnosti. Potěšitelné je zjednodušení pro N-^oo ; za velmi obecných podmínek mají odhady, díky platnosti centrální limitní věty, normální rozdělení. Pro disperzi 0 vychází v limitě jednoduché formule A ^1: !>e2 -i i / (5) A ' ■* 0=0 je to zároveň minimální možná hodnota disperze. Odhad metodou maximální věrohodnosti je asymptoticky efektivní. Metoda nejmenšich čtverců Abychom mohli použít, metodu maximální věrohodnosti, musíme znát rozděleni měřených hodnot v závislosti na odhadovaném parametru. V metodě nejmenšich čtverců stačí znalost závislosti středních hodnot E(y^\0) a disperzí D(y^l Q) na parametru 8. Odhad © hledáme, za předpokladu nezávislosti naměřených y^, z podmínky minima součtu čtverců odchylek fr*i D Cyi l e) Vybíráme tedy takovou hodnotu, pro kterou jsou očekávané (modelové) střední hodnoty co nejblíže naměřeným 'y^. Přitom počítáme s tím, že pro hledanou hodnotu 0Q budou odchylky y£-E(y^|©0) zpravidla tím větší, čím větší je disperze y^. Proto jsou v sumě (6) kvadráty odchylek násobeny tzv. vahou 1/D(yjj0). Čím větší je disperze i-tého bodu, tím menší je jeho váha a relativní příspěvek do součtu; podmínka minima S povoluje v tomto bodě větší odchylku. Naopak, modelová a naměřená hodnota s malou disperzí musí být blízké; velká váha v součtu čtverců ovlivňuje výběr odhadu v tomto směru. - 49 - Odhad 6 ae nezmění, násobíme-li všechny Sieny v součtu (6) stejnou konstantou. To znamená, Že není třeba znát všechny disperze D.íy^l Q), stačí jejich relativní velikosti. Jsou-li všechny D(y4l8) stejné a nezávislé na 9, neuplatní se v odhadu 9 z nejmenších čtverců vůbec; potom hledáme minimum sumy n - -;2 n -2 ] i=l i=l (7) Zde jsme zavedli nové označení f^(9) pro funkční závislost i4té hodnoty modelu měřených hodnot na parametru. Takový zápis-je běžný v situaci, kdy měřené hodnoty y* jsou součtem (8) yi = Ve)+ei hodnot modelu a náhodné chyby s nulovou střední hodnotou. Často jsou měřené údaje získány při různých (známých) hodnotách nějakého parametru x, což zapíšeme symbolicky jako fíx^e) i (9> Pozoruhodné vlastnosti má odhad metodou nejmenších čtverců v přípa- ■ í& \ - dě lineárního modelu, kdy E(y^[ ©í lineární funkcí 6 a D(y. [ e). nff e nezávisí. Především jsou odhady z minima S lineárními funkcemi y^, jsou nevychýlené při libovolném N a mají minimální disperzi ze všech možných nevychýlených lineárních odhadů (Gaussova-Markova věta). Tyto vlastnosti nezávisí na rozdělení dat,- jsou dány pouze linearitou modelu. Rozděleni dat Mají-li měřené hodnoty y^ normální rozdělení (4.1) se středními hod-notami f^(9) a disperzemi 6^ nezávislými na 9, fíy^e) = •exp* -•-5 V2tf ei 1 2€í? (10) vyjde velmi jednoduchá souvislost logaritmu věrohodnosti (4) a součtu Čtverců (6): [2 i=i v 2 e: (v^nr6'i)y= -—- ^íníx/Suerj J 2 1=1 " Protože druhý Člen na pravé straně (11) na 9 nezávisí, maximum věrohodnosti L nastává pro tutéž hodnotu & jako minimum součtu čtverců S. Obě metody odhadu jsou v tomto případě ekvivalentní. Data, která mají přibližně normální rozděleni, se prakticky vyskytují velmí Častp; jejich zpracování budeme věnovat největší pozornost. Je-li rozdělení jiné a přitom známé, jé obvykle výhodné využít metodu maximální - 50 - věrohodnosti. S odhadem parametrů z dat s rozdělením jiným než normálním se setkáme v §§ 13-15. T případě neznámého rozdělení dat je zpravidla preferována metoda nejmenších Čtverců, díky jejím optimálním vlastnostem pro lineární modely (nezávisle na rozdělení). Formulace odhadu je jednoduchá a názorná, což jistě přispívá k popularitě této metody; používá se velmi Často pro,nelineární metody, kdy už diskutované optimální vlastnosti nemá. Volba metody odhadu by měla být adekvátní důležitosti řešeného problému a náročnosti experimentální práce. Bylo by nesmyslné znehodnotit výsledky obtížných měření na drahých aparaturách jednoduchou neefektivní me--todou. Na druhé straně je v mnoha situacích hledaní optimální metody nepřiměřeně náročné, mnohem výhodnější může být použití málo efektivní metody s tím, že potřebnou přesnost zajistíme třeba opakováním měřeni. Poznámka o inverzní pravděpodobnosti V předchozích úvahách jsme hledaný parametr 8Q považovali za pevnou, i když neznámou, charakteristiku měřeného objektu, která se projeví v rozdělení odhadu 8. Pomocí symbolu podmíněné pravděpodobnosti (§1) označíme hustotu odhadu f(8[8o), Pakt, Že různé hodnoty 8q vedou k různým rozděle- lením odhadu umožňuje formulaci pravděpodobnostních závěrů o souvislosti hodnoty © získané z konkrétního měření s hledaným 8Q. O problému hledání 6q se dá hovořit úplně jiným způsobem: pozorovaná hodnota & specifikuje, které z možných hodnot 8q jsou více a které méně pravděpodobné. Tento pohled na.problém odhadu je vyjádřen zavedením , A . A ;rozdělení p(80|©), ve kterém je 8 proměnnou a 8 podmínkou (obráceně, než v hořejší hustotě fíej©^)). Pravděpodobnosti p se označují jako inverzní. Použití pojmu inverzní pravděpodobnosti může být velmi přitažlivé; otázka "jaká je pravděpodobnost toho, že skutečná hodnota je ©0, když z měření vychází 8?" se zdá být položena správně. Manipulace a p(8 [8) je založena na.Bayesově teorému (1.10), přesněji řečeno na jistém způsobu-jeho interpretace. Nebudeme se tímto problémem zabývat, odkážeme pouze na podrobnou a zajímavou diskusi v knize . Přidržíme se běžného chápání odhadované veličiny jako neznámé konstanty a inverzní pravděpodobnost p(0ol©) používat nebudeme. 11. Přiklad měřeni časového intervalu Ukážeme, jak se dají prostředky teorie pravděpodobnosti a matematické statistiky použít v konkrétním případě - při zpracování dat získaných ručním měřením známého časového intervalu tQ=2s z příkladu v § 2. Celý postup založíme na předpokladu, Že se rozdělení naměřených hodnot dá dobře aproximovat normální hustotou; k posouzení vhodnosti této aproximace se vrátíme na konci tohoto paragrafu. Vše co se dá říci o četnostech možných výsledků měření je tedy obsaženo ve dvou parametrech normálního rozdělení - 51 - (1) 2 Střední hodnota je rovna hledané veličině t a disperze 6" (nebo standardní odchylka^) charakterizuje chyby měření. Zapomeňme na chvíli, že střední hodnotu tQ známe; naSím úkolem je odhadnout t a 0 z naměřených hodnot t.,!*!,... ,200. Ptáme se: které čísla t a G2 v normálním rozdělení nejlépe souhlasí s tím, co jsme ve dvou stech měření zaregistrovali? Nejlepší dosud známá odpověS na tuto otázku je ta, že je třeba parametry najít tak, aby s nimi byla právě tato naměřená data nejvěrohodnější (§ 10). Protože předpokládáme nezávislost jednotlivých t^, je hustota pravděpodobnosti N-tice výsledků rovna součinu hustot (1) N -i r (t.-t )2 1 L=H -W«P - 1 ° • (2) i={ si/žŕ L 262 J Maximum věrohodnosti L najdeme nejlépe jako maximum funkce lnL(to, 62) = - £" (ti"to) -4 (In62+in2tt) . (3) i-1 2€2 2 Z podmínek maxima o(lnL)V^tc= Oj 3(lnL)/&6 =0 dostaneme odhady i=l i=l Podmínka maxima L vzhledem k t je totožná s podmínkou minima součtu o čtverců odchylek "^"^o* a Z kompletních dat (N=200) vychází v našem příkladě to=1.99281s, 62 =0.1335s. To jsou ovšem hodnoty náhodných proměnných - při opakování celého experimentu budou vycházet různě. Rozdělení t je podle (4.8) a (1) normální se střední hodnotou t a disperzí D(t )=C2/Bf. Rozdělení ? 2 *l 1 náhodné proměnné N6 /ť> je 7l s K-l stupněm volnosti (§ 8); 5 se vztahu (4) se totiž dá napsat jako součet N-l kvadrátů nezávislých lineárních kombinací veličin t^, z nichž každá má střední hodnotu nula a disperzi 6* . Instruktivní je ověření tohoto faktu pro K=2. Odhad 6" je vychýl e protože střední hodnota rozdělení je N-l (viz(8.2)), odkud vyjde střední hodnota E(6 ) = €> (N-l)/Nf6 . Podmínka konzistence odhadu 6 ov ěem splněna je (pro N-»co je EÍ^J-ýg2). Je zřejmé, že nevychýleným od-2 hadem disperze í> je veličina N 1=1 pro yětší K je ovšem rozdíl mezí odhady Í4) a (4a) nepodstatný. a Znalost rozdělení tQ a 6 umožňuje zformulovat výsledek měření, totiž pravděpodobnostní závěry o souvislosti tl s hledanou hodnotou t . Né-hodné proměnné 4LS-= _o_o- (5) ^Nř/fíN-DG2] i|ř/(N-D mé podle (8.8) Studentovo rozdělení s N-l stupněm volnosti- Označíme-ii (6) můžeme vypočíst pravděpodobnost, že tft leží v intervalu (tn-k86 (2.056Í0.O59)s, (1-963-0.057)8, (1.862Í0.0Í5 )8, (9) V obrázku 22 vidíme názorně souvislost odhadu a správné hodnoty* Shodu pravděpodobnostních tvrzení o intervalových odhadech s pozorovanou skutečností po soudíme svant i tat ívně» Ze Čtyřiceti intervalů v obr. 22 jen dvacet obsahuje správnou hodnotu tQ. S pomocí tabulek v dodatku D2 zjistíme, že pro !í-l=4 stupně volnosti je pravděpodobnost (7) zhruba P=0.62 (a ne 0.683 jako v případě velkého Ní) pro interval t - S, t.j. k»l. PoÔet n příznivých případů (interval obsahuje tQ} je náhodné veličina s binomickým rozdělením* Její střední hodnota je 40x0.62=24^8 a odmocnina z disperze "\T(40x0, 62x(l-0. 62)) & 3.1 (víz § 7). Kromě velsi pravděpodobných hodnot (25,24,26 atd,) se tedy při opakování celého pokusu občas objeví poněkud ^aenší nebo větší počet příznivých případů* Použijeme-li.aproximace binomického rozdělení normálním, dostaneme pomocí distribuční funkce (4.5) pravděpodobností že počet příz~ nivých případů bude laenší než střední hodnota alespoň o tolik co v naěem případě; P(n<2O.5)K$(20ľ5"24-8)ía.O.083 . 3.1 Není tedy celkem žádný důvod k podezření, že naše intervalové odhady nemají požadovaný význam. Pokud jde o počet příznivých případů v obrs 22, pozorovali jsme prostě výsledek, který se objeví zhruba jedenkrát v každých dvanácti opakováních. Hořejší ilvaha je jednoduchým příkladem statistického testu hypotézy, cestovanou hypotézou je pravděpodobnostní obsah P=0„62 intervalového odhadu, předpovídající prostřednictvím binomického rozdělení pravděpodobnosti všech možných výsledků. Je-li pravděpodobnost pozorovaného výsledku příliš mali, máme pochybnosti o správnosti hypotézy. Zřejmě není možné určit přesnou hranici pravděpodobnosti pro zamítnutí hypotézy, protože i málo pravděpodobné jevy mohou nastat. Musíme se smířit s omezenými možnostmi, které máme při studiu náhodných jevů. To samozřejmě neznamená, že výsledky statistických testů jsou bezcenné. Kdyby počet příznivých případů v obr. 22 byl například jen 15, měli bychom pádný důvod k domněnce, Že je testovaná hypotéza nesprávné (takový případ, pokud je hypotéza správné, nenastává Častěji než agí jednou v tisíci pokusech). Chceme-li udat intervalové odhady s N=5 ve standardním tvaruf t.j* s pravděpodobností (7) rovnou 0.683,.musíme zvolit k=1.142 (viz tabulku v dodatku 1)2). Pro P=0f954 je třeba Š" násobit faktorem k=2.858j z takto zvětšených intervalů v obrr 22 pak už jen" tři (4.,12» a 33.) neobsahují hodnotu t =2af což je v dobré shodě se střední hodnotou počtu příznivých případů 40x0a954ftí 36.2« Stojí zato všimnout si odhadu se čtvrté pětice (poslední v (9)>: í toto se "náhodou" může stát (s pomocí tabulek v D2 z;-_ = -.i = me, že o něco méně jak v jednom ze sta pokusů). Důležitým faktem je nutnost n + ŕ zvětait interval t - o faktorem k pro dosažení požadovaného pravděpodobnostního obsahu P, a to tím více, íím menší je počet stupňů volnosti N-l a čím větěí je P. To je vidět přehledně na distribučních funkcích Studentova rozdělení v obr, 23» Rozděleni naměřených hodnot Odhady Í4) jsou založeny na předpokladu, že naměřené hodnoty magí normální rozdělení (1). To věak může být nanejvýš aproximace; především víme, že t^ může nabývat pouze diskrétních hodnot, i když dosti jemně odstupňovaných. Déle je zřejmé, že výsledkem měření nebude nikdy záporné číslo, existuje jistě i horní hranice. Přesto je normální rozdělení v tomto případě velmi dobrou aproximací. Částečně je to vidět v histogramu v / obr. 2. Je třeba si ovšem uvědomit, že četnosti v jednotlivých sloupcích jsou náhodné veličiny (s multinomickým rozdělením, § 9). Mohou, podle (9,4), silně kolísat kolem středních hodnot a tím ztěžovat srovnání s prů4 během hustoty pravděpodobnosti. Lepší je použít tzv. empirické distribuční funkce {O pro t'N fři4/N ________ ct —_____ "5 • 111 «1 F1Ľ 77^' s2 1i£«w/»r' 2fe Y, lXg2)^Jr pro N^co, (12Í s asymptoticky normálním rozdělením. Z našich 200 hodnot t^ vychází g^-0.218, g2=-0.108. Odlišnost od nuly je málo významná, protože střední kvadratické odchylky j30u podle (12) zhruba ^Dig^) &0.17, ^ĎTg^Tí^O.35] s pravděpodobností 58.3% čekáme g^ v intervalu - 0.17, g2 v intervalu. ±035. Důvody k použití normální hustoty (1) v našem příkladě jsou tedy né- 1 sledující. Shoda s naměřenými daty je natolik dobrá, Že ani pro skutečné *M neznámé (diskrétní!) rozděleni nemůžeme čekat výrazné zlepšení. Přitom dostaneme jednoduchým způsobem optimální odhad měřené veličiny a jeho pravděpodobnostní charakteristiku* Výsledek měření (8) nemůžeme podstatně zlepšit hledáním a zpracováním jiného rozdělení, které hy snad lépe vystihovalo situaci (diskrétní, zhora i zdola ohraničené). Jednou větou: normální rozděleni je zde aproximaci, která poskytuje vše co k dosažení cíle potřebujeme. 12. Odhad přímo měřených hodnot Podstata statistického odhadu přímo měřených hodnot rozdělených nor-málně je popsána a ilustrována na příkladu konkrétního měření v předcho- P zím paragrafu, V tomto odstavci postup zobecníme pro případ různých vah naměřených hodnot a shrneme do přehledu jednotlivých kroků zpracování dat«j| Předpokládejme, že máme soubor nezávislých naměřených hodnot y^,...,yn s normálním rozdělením kolem hledané střední hodnoty 6Q a s dis^] o 2 perzemi : f(yt) = exp . Smysl vah je zřejmý: jejich podíl w./w. je roven podílu disperzí ST?/o"fj měření s menší disper- zí má větší váhu, musí se více uplatnit v odhadu střední hodnoty. Předpokládejme, že jsme některému měření přiřadili pevnou váhu, nejlépe jednotkovou, a tím jsme definovali rozklad (2) jednoznačně. Případ měření se stejnými vahami dostaneme volbou VJ=It kde £ je jednotková matice. Odhad střední hodnoty 8 Logaritmus věrohodnosti (10.4)N-tice y^ je 262 1 3Ef i=i L (3) a . Maximum funkce věrohodnosti L nastane pro takové 8=8, pro které je-lnL (neboli suma čtverců odchylek) minimální; z podmínky dlnL/d8=0 vychází : é - m"iH . • (4) ■■/■ Éi II "i Odhadem 8 metodou maximální věrohodnosti nebo nejmenších čtverců je vá- O A žené střední hodnota všech dílčích výsledků. Rozdělení 6 je podle (4.8) normální se střední hodnotou a disperzí N e (e) * o . d(e) u h (5) £w. )2 Zľw, i=l 1 Í=l 1 Odhad 8_ intervalem při známém 6" _2__-- Známe-li hodnotu 6*, můžeme využít vztahu (5) k určení intervalu, který obsahuje ©n se zadanou pravděpodobností. Nejkrůtsí z takových intervalů a o íí r mé střed v 8. Označíme standardní odchylku rozdělení 0 symbolem o, tedy podle (5) (6) S použitím distribuční funkce (4.5) normálního rozdělení můžeme vyjádřit pravděpodobnost, že 8Q leží v intervalu 8±ke": p[eoe(0-ko", eVkS)] = pí —^j2i [g w.(yrd)2] Jsou to odhady asymetrie (3.8) a excesu (3.9), které jsou pro normální rozdělení nulové. Disperze náhodných proměnných g^,g2 áeou Bf „ \ _ 6N(N-1) -p./ > _ 24N(N-1)2__ ŕVrl . - (NÍ2)(N+l)(N+3) • D(g2> ~ (N_3HN_2)(N+3)(R,5)' (13) rozdělení a g? jsou asymptoticky normální. Vyjdou-li hodnoty (12) daleko od nuly, máme podezření, že rozdělení dat normální není. Výsledek jg^j^l 2^Ď(g^) neboj^t^2^D{g2) většinou považujeme za významný nesouhlas a předpokladem, protože takový případ nastává při normálně rozdělených datech zřídka (méně jak v 5% případů). Nápadně vybočující hodnoty Velmi často se stane, že odchylku od očekávaného rozdělení dat způsobuješ jedna nebo několik málo nápadně velkých nebo malých hodnot. Jejich přítomnost bývá způsobena nežádoucími vlivy při měření, jako je chybný zápis údaje nebo náhodné krátkodobé porucha měřicí aparatury. Je možné nápadně vybočující'data vynechat a tím měření "zachránit". Přitom je třeba postupovat velmi opatrně a s uvážením možných příčin vybočení, protože vynechání dat, které do souboru patří, je rbvněž nežádoucí. Rozhodující je znalost konkrétního procesu měření, statistika může poskytnout pomocné kriteria pro vyloučení nečekaně velkých nebo malých hodnot. Pro údaje y^,...,yH s normálním rozdělením (1) se dá snadno najít rozdělení maximální hodnoty y„& . Pro jednoduchost zápisu dvou následují- max i cích formulí položíme 6=0 a b"2=l; pro každé y platí - 61 - - 62 - p{W - ríy^y)-.. PíyN -[$(yi]N . To je distribuční funkce Pjjíy^^.) maximální hodnoty? vyjde tedy rovne H~t4 mocnině integrálu pravděpodobnosti (4.5K Odtud dostaneme, e pomocí (2,9) 5 hustotu y2 "ď^TVW " N ^"^max^*? <—f5"* . ÍWÍ Hustoty (15) jsou nakresleny v obr* 26* S rostoucím H se rozdělaní v ■ max posouvá k větším hodnotám a zužuje se* Například pro N=1000 je s velkou pravděpodobnosti yfflexé Í2*5(4.5)g pravděpodobnost 7m&x >4 js malá, Vrótí- me-li se ke střední hodnotě ©c a disperzi v rozdělení {1)9 dostaneme ze (14) pravděpodobnost >m| * 1 -|N(m) (16) ■ ^i max J toho, Že odchylka y^ od 9Q překročí m-nésobek standardní odchylky C.. Pro tři malé hodnoty p je v obrB 27 nakreslena závislost m na N. Je vidSts Že v odůvodněných příoadech můžeme vynechat takové hodnoty y., které jsou o 3-aŽ 4- násobek větší než odhad *o (počítaný ovšem bez vynechávaných hodnot); pravděpodobnost„ že do souboru patří je velmi malá0 Stejně se fla-jí posuzovat nápadně malé hodnoty - menší o U- násobek 6^ než ©gC 13* Příklad měření doby života Částice Nestabilní částice mají omezenou dobu Života - rozpadají see Hospaí je náhodným jeveny který se dá dobře popsat exponenciálním rozdělením (§9)í f(t) = ±- exp (-|r) . ílí Lo Lo f(t) je hustota pravděpodobnosti, že doba které uplyne mezi vznikem a ros-padem částice je tc Gelý proces je popsán jedinou konstantoutCQ> které říkáme doba života. Je to střední hodnota rozdělení (1), které zároveň určuje i disperzi (viz(9*12)): Eít) DCt) = X2 . <*> o* o Život Častíc můžeme pozorovat pomocí stopy v registračním zařízení, stopa, začíná v místě vzniku a končí v místě rozpadu. Dokážeme-li určit rychlost pohybu každé částice, můžeme z délky stopy vypočíst dobu mezi VEn^|^a|(Bai Předpokládejme, Že jsme sledovali N částic a získali N-tici nezávislých hodnot t,. ,...tN* I když se nám podařilo potlačit náhodné chyby v - 63 - procesu měření na zanedbatelnou úroveň, jsou t± nehodná čísla e rozdělen (1). Studujeme náhodný jev; cílem měření je určení konstanty % , jejíž hodnota umožňuje předpovídat pravděpodobnosti prostřednictvím hustoty (ijj a I Optimální odhad 'C dostaneme z maxima věrohodnosti Í10.3) naměřených nezávislých tj: neboli z maxima funkce InL -^i. t4 + Nlntr. (4)j Maximum nastává pro hodnotu T=1^, pro kterou. ^(lnL)/3tS= 0; a i N ^o =¥1^' '<5Í i=l Nejvěrohodnějším odhadem je aritmetický průměr naměřených Časů* Náhodné proměnná Nl£ má gama - rozdělej hodnota a disperze odhadu jsou proměnná Nt^ má gama - rozdělení (9.16) a parametry b^N, 8=1/1^. Střední I Odhad (5) je konzistentní a nevychýlený; jeho rozdělení je asymptoticky normální. Skutečné měření dob života částic vyžaduje mohutné experimentální z řízení. My se spokojíme se simulací pomocí počítače, vhodným programem £U ne rujeme N-tice pseudonáhodných čísel x^ s rovnoměrným rozdělením gíx^lB pro x^číO,!). Transformací ťi X ~%>lnxí í7 dostaneme peeudonáhodné čísla s hustotou (1), což snadno ověříme < pomocí ■ (2*5). Protože na volbě jednotek času v našem simulovaném experimentu n označili nemařené data uspořádané podle velikosti. Volba m«0 znamená průměr x*j při m=K-l pro N liché, resp. m»N-2 pro K sudé, je vyrovnaný, průměr (3) roven mediánu.x. Volbou m v daném rozmezí dostáváme odhady, které jsou jistým kompromisem mezi vlastnostmi x a *x. Pozoruhodný je fakt, Se pro mas0.54K je v asymptotická limitě disperze vyrovnaného průměru pro každé rozdělení z trojice - normální, dvojné exponenciální, Cauchyovó - pouze o necelou Čtvrtinu větší než je disperze příslušného optimálního odhadu* Příklad odhadu střední hodnoty rovnoměrného rozděleni Srovnáme- podrobněji odhad polohy rovnoměrného rozdělení fíx) - 1, X6C-1/2, 1/2) (4) průměrem x a polovičním soustem krajních hodnot x naměřených nezávislých tidajů x^, • • • ,xjj, Průměr, má rozdělení blízké k normálnímu (§ 5, obr, 6) ; se středem 0 a disperzí 1/Í12N). Rozděleni x* se dá nejsnáze najit z distribučních funkci P(Xjj) » (l/2+xM)K, Fíxffi) * l-U/Z-x^)1* maxima xjj a minima x^ v N~ňezávialých pokusech. Výsledkem je symetrická hustota, tvořená polynomy stupně 2K-1 v intervalech (-1,0) a (0,1). V obrázku 30 je nakreslena pro dví hodnoty,N. Pro střední hodnotu a disperzi tohoto rozdělej ni vyjde E(9) - O, D(?) ■ N/[2(N+l)2(N+2)]. . (5) Rosdělsní polosumy krajních hodnot je pro větSÍ N u28í než rozděleni průměrt (obr. 30). JeStě názorněji je vidět podstatně větěí efektivnost odhadu pomocí T? v obr» 31. Tam jsou nakresleny intervalové odhady pro růz-r ný poSet hodů v souboru dat, generovaném v počítafii. S pomooí distribučních funkcí íi i byly intervaly zkonstruovány tak, aby měly standardní . pravděpodobnostní obsah 68.3%. i - 67 - -S. IE -0.05 0. 00 0. 05 8. 10 Obr. 30. Hustoty pravděpodobnosti polovičního součtu (plné čára) a průměru (Čárkovaná aera) z N hodnot s rovnoměrným rozdělením (14.4). A X 2. 30 2. 10 1.70 h průměr x poiosumo krajních hodnot _i_!__ I I ! I I I i I 1.0 1.5 2.0 Z.5 3=0 logN Obr. 31„ Intervalová odhady polohy: rovnoměrného rozděleni (soubor N hodnot generován v počítači) - 68 - 15« Příklad odhadu dvou parametrů lineárního modelu Metody odhadu více parametrů budeme ilustrovat na dvojrozměrném případě , který je dostatečně obecný a přitom velmi názorný. Předpokládejme, že pro různé hodnoty nezávisle proměnné x mě*říme hodnoty závisle proměnné y * V"box2 " . (1) Závislost y(x) je určena dvojicí parametrů aQÍ bQ, které vystupují v modelu (1) lineárně5 jejich hodnoty hledáme nepřímo z naměřených dvojic xs y. 0 linearitě modelu rozhoduje závislost na parametrech, nikoliv ha nezávisle proměnné4 Předpokládejme dále3 že nezávisle proměnnou můžeme určit přesně- (nebo se zanedbatelnou chybou) a výsledkem měření je N hodnot proměnné y; yi = ao+boxi+ei» i=le....N, • (23 pře N-tiei pevných hodnot x^. Náhodná ehyba i-té hodnoty (označili jsme ji £^) má symetrické rozdělení se střední hodnotou nula. Výsledky měření, t.j. N-tice hodnot (x. ,y\. ), byly simulovány na počítači za pomoci generé-toru pseudonéhodných čísel. Zvolili jsme ao fi bo f 2 » (3) ekvidistantní sít x^ z intervalu <0,1^: xi - (i-l)/(N-l), i=l,...,N, .(4) a několik možností rozdělení chyb. Příklad takto generovaných "experimentálních" dat ukazuji křížky v obr. 32. Díky rychlosti počítače můžeme generování a zpracování dat mnohokrát opakovat a sledovat souvislost výsledků se správnými hodnotami (3). Normální rozdělení chyb Ukážeme podrobně výsledky výpočtů pro chyby e^rozdělené normálně se stejnou disperzí 6*2 oro vSechne x- • Hustota pravděpodobnosti jednotli- " 1 2 2 •*ých hodnot y^ je tedy normální se střední hodnotou a0+b0xi 8 disperzí 0 J 2*2 r (yi-ao-boxí> (5) 2<£ Předpokládáme samozřejmě nezávislost naměřených hodnot y^ nejvěrohodněji Sí odhad parametrů a0s>h0 dostaneme z podmínky maxima logaritmu funkce věrohodnosti 69 - —r • i■■ t-1-r-1-1-r-1— 1 + 3.0 - 2.5 * / 2.0 +y+ * * *>™*-**s * 1.5 Í. B 1 i s 1 i 1 ii j 0.0 0.2 0.4 0.0 0.8 Obr. 32. Závislost (1?.2) generorané pro H«100 š normálne rozdělenou chybou strední kvadratickou odchylkou €T*o.l (křížky) b proložená závislost s odhadem.parametru (13a) (plná Séra), - 70 - (y,-a-bx2)2 lnL « In Pi f (y.) * -XI---- 4- (W+ln^). (6) i-i m 262 2 Maximum (6) vzhledem k a,b nastane právě tehdy, je-li minimální součet Čtverců odchylek hodnot naměřených (y^) a předpovězených modelem (a+bx2): S = J"~(y.-a-bx2)2. (7) i=l Z podmínky 3s/3a ='5s/&b ~ O vyjde soustava dvou lineárních rovnic (říká se j jim normální rovnice? pro hledaná odhady a, b : ! ^+ bHxi =Žľyi' aZľXi + bZlXi=ZyiV (8) ' i 1=1 i=l i=l i=l i=l í * ■ * Je-li determinant soustóvy 1 *-»l:4-2-z: J:^2' . / i=i i=i i=i j=i+i v nenulový (podle (9) k tomu stačí, aby v H-tiei argumentů x^ byly alespoň dva různá), existuje právě jedno řeSenl. Můžeme je napsat explicitně; i=l U j=l . J i=l L j«l -1 Odhady jsou lineárními kombinacemi normálně rozdělených naměřených hodnot y^ - mají tedy také normální rozdělení. Přímým výpočtem můžeme najít střední hodnoty a druhé momenty; s pomoeí (3.18) dostáváme E(a) = aQ, E(b*) = bo, " T>&) = <>2(a) XCx4 D(b) = G2(o) = 62£, D(£,b) =|(-Ex^). '(11) • - i=l i=l Využili jsme nezávislosti různých ... Díy-^y^ = ^^.j' kde ^*ij 3e Kro-neckerovo delta (jednička pro i=j, jinak nula). Odhady a, b" jsou vždy kore1 lované, protože D(a,h*)íO. Korelační koeficient závisí pouze na hodnotách x1,...,xN. Stojí zato sí všimnout, že matice druhých momentů (11) je až na faktor 62 rovna inverzní matici soustavy normálních rovnic (8). Je-li disperze jednotlivých hodnot y. známé, víme o odhadech a,b prostřednictvím (11) vše, co vědět můžeme. - 71 - Výpočet s daty z obr* 32 vedl k následujícím hodnotám: a * 1.022, b * 1.971» (13a) ^(a) * 0.0150, S'ío) = 0.0332, ^ = - 0.743. (13b) Proložené závislost a+bx2 je nakreslena v obr. 32s Odhad eliptickou oblasti při známém 6? Při opakovaném pokusu budou body (a,b) vycházet náhodně kolem středu (a0,bo> * (1,2) s normální hustotou s pareaetry (13b). Analogií intervalového odhadu jednoho parametru je zde odhad pomocí oblasti, které obsahuje hledané hodnoty e předepsanou pravděpodobnosti. Nejvýhodnějšl oblastí je vnitřek elipsy s konstantní hustotou (mé při zadaná= pravděpodobnostním' obsahu minimální plochu, čímž nejlépe lokaliz-j^e hledaný bod t rovině parametrů). Z § 6 víme, Že konstrukce takové elipsy vyplývá ze znalosti rozdělení kovariační formy normální hustoty. Eorariaíni rro proměn-, né äjd" se dá napsat ve tvaru ■° u í=i i*i j 1 r2 (a-a )(S-b ) ($-b >21 mé rozdělení ?(2 se dvěma stupni volnosti. Vnitřek elipsy k - konat•. = ?^ mé pravděpodobnostní obsah daný příslušnou distribuční funkcí: p(fr<>0 » p^p Od. (15) Elipsu £ = «\ můžeme interpretovat dvojím způsobem: bod má střed v (a ,b ) nebo v (a\^>) (obr. 33). V obou případech dérá Blata se stejnou ■ /a a. hustotou pravděpodobnosti vzájemné polohy bodů (ao,bQ) a (a,b). První mož-l nost bychom použili pro předpověd výskytu odhadů při znétHi (aotbQ), druhé se hodí pro řešení naší úlohy - elipsami kolem (a,b) se snažíme zasáhnout hledaný bod (a0,bo). Volbou" konstanty J\ určujeme velikost elipsy a tím i její pravděpodobnostní obsah. Například í\ =1 znamená podle (14) elip-' su, které je vepsané do obdélníka ai^a), b-6Tb*) - viz obr.-33. Její pravděpodobnostní obsah je asi 0.4 (hodnota distribuční funkce (15) v bodě 1 ... tabulka v dodatku D2). Při 392-násobném opakování celého pokusu y počítači obsahovala elipsa j =1 bod (1,2) ve 164 případech, což je ve velmi dobré shodě s očekávaným počtem 392x0.4»157. _p ■ _ . -Odhad disperze o ' Neznáme-li 62, můžeme ji odhadnout z naměřených dat. Z podmínky -72 - maxima věrohodnosti vzhledem k 6" (nejlépe s pomocí í 6).. .^InL/3^)=0) dostaneme odhad N - i=i ) = s /n. o (16) Obr* 33. Elipsy J =1 s kovariační a formou J podle (14), ? =-0.74i obdélník st 6^),/^ o). 'V' Sly odhady (13&) bylo 6rjO.0098 V 62 * 0,01. Symbolem S jsme označili tzv. rezid-o iuélní sumu Čtverců, t.j; hodnotu S ze vztáhli (7) v -bodě minima. K^/S2 je ná-[ hodná veličina s X2 rozdělením s po £ tem.! stupňů volnosti rovným K-2 (dá se vyjádřit jako součet N-2 kvadrátů nezá- . vislých proměnných s rozdělením Ní0,1); jednotlivé sčítance v součtu (16) ne- j závislé nejsou!). Odhad (16) je vychýlený t protože jeho střední hodnota je EÍ62) = 62(N-2)/Nf62. Hevycltfleným od- hadem b je Cř= S /(N-2). V našem pří-padS (N=100) je rozdíl mezi ^ a G4^ zanedbatelný"; v pokusu, při kterém vy-dobré shodě se skutečnou disperzí dat Odhad parametrů eliptickou oblastí při neznámé disperzi 6* Podíl /v J—N JÍ— ?~2 6^ S0/(N-2) (17) na neznámé disperzí 6* nezávisí a má podle - (8.11) F-rozd61ení s m=2, m'=N-2 stupni volnosti. Vnitřek elipsy £=A má tedy pravděpodobnostní obsah roven hodnotě příslušné distribuční funkce v A: P(£<20 = F2fN_2<*>. <18> Označíme (19) odhady standardních odchylek a,b, které dostaneme ze vztahů (11) a (17). Jtovnici elipsy pak přepíěeme do tvaru 1 1 2 1-^ C í&"a?^i - 2p -*-— (a-a0)(6-bQ) (b-bQ>* [§(o)]: A. (20) Li - 73 - Pro % =1/2 je to elipsa vepsaná do obdélníka a± 5 (a), bí S"(b) a její pravděpodobnostní obsah je F2^Ď(0.5)£í0.4 (tabulka F-rozdělení je" v D3; vyšla" stejná hodnota jako nahoře pro elipsu £ =1. podle § 8 je rozdělení veličiny 2F2f98 blízké k ?r|). _ Elipsy (20) mají nejen náhodný střed (a,íí), ale i velikost (o"(á), a » o(b) jsou náhodné veličiny). Sledovali jsme je při zmíněném 392-!-nésobném opakování pokusu. Při prvním z nich vyšly" odhady odchylek (19) S*(a) » 0.0148, Síb) = 0.0328, (21) ]a v dalších podle očekávání kolísaly kolem svých středních hodnot ff(a), prfj) ze vztahu (13b). Prvních Čtyřicet elips £=1/2 je nakresleno v obr. i 34* Celkem 169-krát obsahovala elipsa bod (1,2), opět v dobrém souhlasu s předpovězenou pravděpodobností«0.4. V obrázku 34 bychom si měli všimnout toho, jak záporný koeficient korelace rozděluje odhady (a,b) kolem [úhlopříčky z levého horního do pravého dolního rohu. Pravděpodobnostní ob--sah obdélníka, b) je samozřejmě o něco větší. Z obr. 9 v § 6 „. odečteme pro ^- 0.74 pravděpodobnost asi 0.55; pozorované relativní četnost příznivých případů 225/392#0.57 je s ní ve výborné shodě. Intervalové odhady jednotlivých parametrů Zatím jsme se soustředili na odhad obou parametrů současně. Můžeme najít také pravděpodobnostní tvrzení o každém parametru zvláší. Především je zřejmé, Že intervalový odhad aíff(a) (chápaný tak, že sledujeme pouze jsouvislost ärt a a — bez ohledu na to, jak vychází "o) má pravděpodobnostní . ^ 2 a \ Obsah 0.683; marginální rozdělení a je N(aQ, 6 (a)). Stejné tvrzení platí Ío oähadu b-6(&). Pokud disperzi ťí2 neznáme a nemůžeme spočíst €r(e), CCh*) ze vztahu (11),|~~ jmůžeme použit Studentova rozděleni pro sestrojení intervalů pomocí S"(á), toto ze vztahu (19). Postup je přesně stejný jako v případě přímo měřené _ hodnoty (§12). Je-li hodnota jednoho z parametrů známá, má odhad druhého opět normál-fní rozdělení, s disperzí zmenšenou faktorem l-o2 (viz podmíněné rozdělení (6,16), (6.17)). Například fixování hodnoty parametru b=b vede ke zmenše- í disperze á podle vztahů (11) a (12) na D(aTo=bo) = D(a){l-p2) = 6>2/N. .„■ <22) (To je očekávaný výsledek, neboi jde vlastně jen o odhad přímo měřené veli-jčiny z N-tlc.e a£=yi-D0x? normálně rozdělených hodnot se stejnou disperzí ff2. ]JÍné rozdělení dat Posoudíme vliv různých rozdělení chyb 6^ ze vztahu (2) na odhad para-ptertrů. Jde o velmi složitý problém, protože v zásadě každý typ rozdělení 4 - 74 - Obr. 35. Distribuční funkce F - rozdělení a m=2 a různými hodnotami m1.. - 75 - dává jiné formule pro nevěrohodnější odhad a potřebné výpočty mohou být značně komplikované. Stanovíme si relativně skromný cíl: zjistit, jak se osvědčuji vztahy odvozené v předchozí části tohoto odstavce pro normální rozdělení v případech, kdy rozdělení chyb normální není. Navíc budeme postupovat čistě empiricky - vyzkoušíme konkrétní rozdělení v mnohokrát opakovaných pokusech v počítači. Od normálního se jistě hodně liší rovnoměrné rozdělení (§9) s konstantní hustotou (23) i které má podle (9.6) střední hodnotu a^b^ a disperzi o. Ještě méně se jnormélní hustotě podobá funkce 1 V/^íyi-ao-boX246^5/6) f(yi> Je to nesymetrické hustota, která má střední hodnotu a disperzi stejnou jako (23). Přitom má v levém krajním bodě povoleného intervalu singularitu. (Pseudo) náhodná čísla s rozdělením (23) a (24) se dají v počítači i snadno generovat. Aby byl výpočet rychlejší, zvolíme menši počet bodu v závislosti (2): N=7. Budeme v každém pokusu konstruovat elipsy (20) ě oblíbeným pravděpo-': .dobnostním obsahem 0.683 a 0.954 a sledovat počet případů, kdy v nich ble-idaný bod (1,2) leží. Při malém počtu stupňů volnosti m'= N-2 = 5 se F - ros dělení značně liší od limitního % , jak ukazují distribuční funkce v obr. i35« Odtud (nebo z tabulky D3) zjistíme, že pro dvě uvedené pravděpodobnos-, ,ti musíme zvolit konstantu í\ ve (20) po řadě 1.46 a 6.16. V následující ta-f ibulce jsou shrnuty výsledky simulovaných experimentů. menší elipsa (68,3%) větší elipsa (95,4%) pozorovaný počet úspěchů očekávaný interval pozorovaný počet úspěchů oč ekávaný interval rozdělení- dat počet pokusů normální (5) rovnoměrné (23) se singularitou (24) — ......,.. • 500 6510 10000 353 4449 6794 341.5±21 4446 Í78 6830 Í96 476 6170 9327 477- 9.4 . 6211^34 9540±42 ^očet úspěchů je náhodná veličina a binomickým rozdělením, které se dá pro velký počet pokusů dobře aproximovat normální hustotou. Odtud jsme také 'určili intervaly, do kterých by měly pozorované počty padnout s pravděpo- - 76 - dobnosti 95.4& C- dvě standardní odchylky). Pro normálně rozdělená data v prvním řádku je vše v pořádku. Pozoruhodná je ovšem dobrá shoda pro obě další rozdělení. Jedině údaj pro větší elipsu v posledním řádku signalizuje závažný nesouhlas mezi pozorovaným a očekávaným údajem (liší se zhruba b 5 standardních odchylek). Na druhé straně je však většinou nepodstatné, ÍSe místo 0.954 je pravděpodobnostní obsah odhadu pouze 0.93. Celkově můžeme zhodnotit funkci postupu odvozeného pro normální rozdělení jako překvapivě dobrou. Předpověd vlastností odhadů podle vztahů (10), (19) a (20) s testovacím rozdělením dat (23) a (24) ty se dala provést přesně, byla by ale ■ značně namáhavá. Použitelnost postupu můžeme vysvětlit v hrubých rysech pomocí centrální limitní věty - rozdělení odhadů (10) se blíží normálnímu i pro jiná rozdělení dat. Dobré funkce studovaného postupu zpracování pro různá rozdělení je velmi vítaná. Neznamená to ale, Že by nemělo cenu hledat jiné postupy respektující zvláštnosti rozdělení dat; zpracování pak: ■oáze být efekt i vně jši (viz příklad odhadu polohy rovnoměrného rozdělení v § 14). 16. Odhad parametrů lineérního modelu Postup odhadu parametrů lineárního modelu, odvozený a ilustrovaný na ipříkladu v .§ 15, zobecníme pro případ různých vah naměřených hodnot a libovolného počtu parametrů. Budeme používat maticové zápisy podle konvencí jpoužitých v § 6* Předpokládejme, Že hledáme hodnoty K parametrů 0,.♦,8^ (uspořádáme je do sloupcového vektoru 6 nebo po transpozici do řádkového vektoru ^=(8^,.... ,&K) )* Měříme hodnoty y^,... ,yH, které jsou lineárními funkcemi y = A 6 , (1) kde y je vektor s N složkami, _y = (y-^... »%'* & ^e matice koeficientů e N řádky a K sloupci (stručně NxK). Abychom mohli odhadnout všechny pa-irametry, musí být N^Kj o matici předpokládáme, že má hodnost K. Obvykle dostáváme hodnoty y^ měřením při různých (známých) hodnotách jiné proměnné xs na které y také závisí: y(x) = elf1(x)+. ^+S^fK(x)( (2) Jede f_(x) ...,f„(x) jsou zadané lineárně nezávislé funkce. Model (2) je . 1 K- ^lineární vzhledem k parametrům 6, matice ^A má prvky A f1(x1) fK(x1) (3) Předpokládejme dále, Že y^mé N-rozměrné normální rozděleni se středními hodnotami E(y) = ^A©^ a diagonální maticí druhých momentů £ i (slož-ky _y jsou nezávislé). Zde je. stejně jako v § 12, W matice vah, 6"2 disperze pro jednotku váhy. Odhad parametrů & _o Z principu maximální věrohodnosti (zobecněním postupu z § 15) dostaneme pro odhad ©_ hledaných parametrů ô soustavu lineárních rovnic (ATW A)ě= AT Wy . (A) ftíká se jí soustava normálních rovnic. Podle předpokladu je matice H * ATW A . • (5) /v/ íS/ fy* nt regulární - její hodnost je K. Soustava (4) má tedy právě jedno řešení © = H A" W y «, (6) Odhad © je lineární funkcí normálně rozděleného vektoru y, mé tedy také normální rozdělení* Střední hodnoty a matice druhých momentů jsou = ©0 t D(9) = E^(9-©0)(^-©0)T]= o^Hf1. (7) Odhad &o elipsoidem při známém b Z § 6 víme, že kovariační forma (6-QJTMQ-9) (8) je náhodná proměnné s rozdělením X s K stupni volnosti. Pro kladnou konstantu A znamená splnění nerovnosti JTw =-| ^.(y,-?.)2 do) i=l Jako SQ jsme označili tav. reziduálni součet čtverců odchylek. J - 78 - Dá 8e dokázat, že veličina N€^/62 má rozdělení X^_Kt odtud můžeme najít intervalově odhady pro (T . Odhad (10) je vychýlený, protože jeho střední hodnota je ECS2) = (62/IT)E(?í2_K.) = £2(N-k)/N. Nevychýleným odhadem disperze je například . A „ ^2* N 2 1 n a 2 ^ ="í£k 6 ' =TílK21Wiíyi"yi) ' (l0a) Odhad GQ elipsoidem při odhadované disperzi Známého rozdělení kovariační formy (8) a odhadu 62 (10) využijeme k odhadu 0O elipsoidem v prostoru parametrů; podíl , iyg _ d-i^Hd-eQ)/K " Neř/fe^N-K)] jj = ^5%*. ó=i."->k. Známe-li 6"2, najdeme intervalové odhady G.Ík€T. pomocí normální distribúcii « ní funkce ze vztahu (12.7). Odhadujeme-li <>2 z naměřených dat, vyjdeme z podílu ten na 62 nezávisí a má Studentovo rozdělení s N-K stupni volnosti. Označí- a najdeme pravděpodobnostní obsah intervalu %Z kŠ\ pomocí distribuční -S» (15) 33 N-K - 79 - funkce FN_K Studentova rozdělení (viz (12.11)). Pro dostatečně velký počet stupňů volnosti N-k (£30) má interval 9.-d\ pravděpodobnostní obsah 0.683 a 3 3 * stejný, jako mé interval e.ÍG'.. 3 3 Souvislost se sumou čtverců odchylek Podmínka maxima věrohodnosti je při normálně rozdělených datech ekvivalentní s podmínkou minima součtu čtverců - viz (10.11). V našem případě K- rozměrného vektoru parametrů _8 a diagonální matice vah J£ je suma čtverců rovna K K S ■ (y-A9)TW(y-A9) - ZIw. (y.- Zľa, .©-)2. — **"- ~ - ~- 5_=i t i -;=2 ^3 3 (16) Snadno se můžeme přesvědčit, že podmínka minima S vzhledem k 9, t.j. 5S/90^=.. .=^S/ô©K=0, vede skutečně ^soustavu normálních rovnic (4). Pro součet čtverců (16) v minimu, t.j. v bodě Jg, dostaneme jednoduchý vztal (17) S =S(9) - y^y-a&^Wy+G^HQ = y^-Wy-O^Wy. Reziduálni sumu čtverců tedy můžeme vypoířst tak, že od váženého součtu čtverců naměřených hodnot (y JJy) odečteme skalární součin vektoru řešení a pravé strany normálních rovnic (4). Užitečné je také vyjádření S jako funle-ce posunutí A z minima 9: S(6+A) •= S+£?U&. O — rJ — (18) Matice H kovariačnl formy (8) popisuje také funkci S v prostoru parametrů 9. L0 - 0.8 - 0. 8 0. 4 - 0. 2 ~ 0„0 - Obr. 36. Distribuční funkce X - rozdělení s K stupni volnosti. - 80 - 17- Odhad parametrů nelineárního modelu Měřená hodnoty y1,....yK mohou záviset-na hledaných parametrech ©^,.. • ,©^ nelineárně; yi = hi-.- • »t Í*lf .. . ,N. (1) Předpokládejme, že y^ jsou nezávislé normálně rozdělené proměnné se středními hodnotami E(y^) = n^(eQ^» • • • »e0j^) a diagonální kovariační maticí 2 —1 2 £ - & JS tW 3e diagonální matice vah, 6 disperze pro jednotkovou váhu). Funkce věrohodnosti pozorované N-tice y při hodnotách parametrů 0 je tedy L se2/^ J- L = GTŤ"^! Maximum L vzhledem k 6 nastane tehdy, je-li maximální - k tomu stačí najít minimum váženého součtu čtverců odchylek pozorovaných a modelových hodnot v prostoru parametrů ©; K S = ^^[yi"11!^!* • • • í6^] 2 =[y-hí&)jT w[y-h(6)] - (4) Nalezení odhadu 8 hledaného vektoru gQ je díky nelinearitě modelových funkcí h^ podstatně obtížnější než v lineárním případě (§§ 15,16),' kde stačí sestavit a vyřešit soustavu lineárních rovnic* Podle (16-6) jsme mohli dokonce vyjádřit odhad jako explicitní lineární funkci naměřených dat. Zde je závislost 6 na y vyjádřena pouze implicitně - podmínkou maxima L nebo minima S. Tím je dána druhá komplikace: rozdělení © není normální a je zpravidla obtížné ho najít. a Hledání odhadu 9 svěříme vhodnému numerickému algoritmu nelineární minimalizace a samočinnému počítači. I v lineárním případě -řešíme normální rovnice (16.4); tam je však výpočet rychlý a vždy jednoznačný. Nelineární model vede obvykle k mnohem náročnějším (delším) strojovým výpočtům a k možnosti nalezení "falešného" minima. Při interpretaci výsledků je třeba e touto eventualitou počítat. Druhou komplikaci, t, j. neznalost rozdělení odhadu 6, obcházíme zpravidla aproximací nelineárního modelu lineárním. Jde v zásadě o použití přibližných formulí (3.28) a (3.29) pro druhé momenty funkcí náhodných proměnných, neboli o přibližné vyjádření "přenoau chyb měřených_y do chyb hledaných parametrů". V okolí odhadu Q aproximujeme funkce (1) lineárními Členy Taylorova rozvoje; v maticovém zápisu je SI - kde prvky matice NxK koeficiei. rozvoje jsou d rivace h v bodě Q: a a Symbolem y jsme označili hodno y modelových funkcí (1) v bodě &. V této aproximaci je suma Čtverců (6) přibližně rovna S^(y-y)TW(y-y") +ATATWAA- í +^THA, (7) kde jsme zavedli označení N (8) m f— ?3h. 15 h H = ATÍA, neboli (H).ÍW1 = / w,__i í-l ^ m A Při odvození vztahu (7) jsme využili faktu,, že vektor íy-y) WA je úměrný gradientu 3 i»l f~ , 3=1,...,K (9) sumy čtverců (4) a je tedy v minimu S nulový. Pokud je lineární aproximace (5) dobrá, můžeme použít všech výsled- - a ků z -oředchozíno paragrafu. Rozdělení odhadu 6 bude přibližně normální s 2 —1 ~" kovarieční maticí 6 H (viz (16.7)), kde prvky matice počítáme z (8). Použitelnost lineární aproximace zálesí na průběhu funkcí v tak velké' oblasti prostoru parametrů 6, ve které je hustota pravděpodobnosti výsled- a 2 ku 6 výrazně odliänó od nuly. Záleží teOy i na disperzi "6 naměřených hod-_ not y (viz diskusi o přibližných formulích v § 3). Představu o možnostech — lineárni aproximace poskytuje přiklad v následujícím odstavci. 18. Příklad odhadu parametrů nelineárního modelu Ukážeme použití metod předchozího paragrafu na příkladě odhadu tří ( r a of o o parametrů íč?rtf P„ a oCn modelu Měříme N-tici hodnot y^i^)* £j pro známé x^...,^, ^ je náhodná chyba. Funkce (1) popisuje například tzv. Lorentzovský spektrální profil (zá vislost intenzity na frekvenci) čáry s centrální frekvencí QQ a poloáířkou CQÍ přičtený ke konstantnímu pozadích . Vzhledem k Q.q, Pq je model (1) nelineární, Uo je lineární parametr. Naměřené data byla simulována v počítači. Zvolili jsme - 82 - &o = °. rG = 1, ^ = 0-5, (2) ekvidistantní sít s N=50 hodnotami x. z intervalu^-4,4^> a normálne rozdělené pseudonáhodné chyby £ se střední hodnotou 0 a standardní odchylkou e'ft) = o.i C3) stejnou pro všechny body x^. V obrázku 37 jsou takto generovaná data znázorněna křížky. Odhady Si, P a oí jsine našli numerickou minimalizací součtu čtverců (17.4) a jednotkovými vahami (disperze jednotlivých y^ jsou stejné): s&,r\oO -^Zpi-y^i^^^]2 • <*> ' í=i Linearity modelu vzhledem k parametru o( jsme nevyužili. Použitý minimali-začni algoritmus hledá miminům funkce pomocí gradientu a matice druhých derivací (tzv. hessiánu). Označíme 6^, ©2, 0-j po řadě parametry 51, P , oí. • složky gradientu a hessiánu jsou r* -2Z_[yi-yíxi}J^— • J 1=1 (5) ^ "^v^rr m1'*"'3' T hessiánu zanedbáváme členy s druhými derivacemi (to je tsv. linearizace) a používáme vlastně (až na faktor 2) matici tí ze vztahu (17.8): 1 Vedlejším produktem minimalizace jo tedy užitečná matice, která podle § 17 /\ 2 —1 popisuje rozděleni odhadu 6 parametrů v lineárním přiblížení (6 (^35, je kovariační maticí normálního rozdělení 0). Suma čtverců (4) je minimální pro a a . a Si= 0.0470, P= 0.999, = S^ÍP-r)2/^1)^ . | ' A C10> P vzroste hodnota paraboly S o €r(6). . Obě funkce S, S jsou nakresleny v obr, 38; je vidět, že se v intier-valu ŕ-Si liší velmi málo. Přestože závislost modelové funkce (1) na P --je nelineární, odhady P jsou koncentrovány do dostatečně malého intervalu, v němž je lineární přiblížení vyhovující., Je třeba él uvědomitř Že veli-kost intervalu 2'Sp je přímo úměrná střední kvadratická odchylce ťí(£) naměřených hodnot. Budou-li chyby dat větší než v obr. 37, vliv nelinearity vzroste;naopak, pro menší chyby se bude dále zmenšovat* - . Započtení nelinearity modelu při konstrukci intervalového odhadu pro libovolný parametr 8 je možné a výsledek platný v asymptotické limitě N-^co je jednoduchý ([Wl, § 9.3). Krajní body intervalu e pravdě po dobnoat-' nlm obsahem 68.3% jsou takové, ve kterých je hodnota S (a nikoli parabo-lické aproximace S) o ?>(£-) větší než v minimu:' s(S-SH) = síe*^) = so+^(C). ' - (lir Podobně vzrůst S o k2G2(£) definuje interval s pravděpodobnostním obsahem stejným, jako má v lineární aproximaci interval ©-kS" (například 95°4% s ks2 a tedy s posunutím z minima o 462(&)í* Výsledkem je zpravidla interval, - 84 - y -4.-2 0 2 4 X •• ____. | . *_________ ___.____........ v Obr, 37» Experimentální data (křížky) a proložená závislost s parametry (18,8) (plná čára). i-í-r~—'-!-;—~-r 0. 90 0. 95 1. 00 1* 05 10 r Obr. 38. Závislost součtu Čtverců (18.10) a (18.12) na P, plná čára; parabolické aproximace, čárkovaná čára. - 85 - A který nemé stred v 9. V našem příkladě jsou podle obrázku 38 kladné odchylky poněkud větší než záporné. Závislosti S(P), EKP) podle vztahu (10) souvisí e marginálním rozdělením P t které je v lineárním přiblížení normální s disperzí G2 (£-) (Hj1) 22» Za povšimnuti stojí- ještě závislosti sumy čtverců na P, odpovídající podmíněnému rozdělení při pevných hodnotách a o(■ o( zbylých parametrů: s'íd = s^P.o^), Š'(r> « ^+(h)22(r-fr)2. (i2) Jako P jsme označili odhad P z podmínky nejmenších Čtverců Sr, je příslušné minimální hodnota. Z dat v obr. 37 vychází a a j T = 0.983, Sp= 0.020 , = 0.484. (13) Funkce S a S osou rovněž v obr. 38 a v oblasti! - nastane-lí tento případt hypotézu HQ zamítneme„ Ěíkáme, že pomocí testu zamítáme HQ ne hladině významnosti o(. (nebo s rizikem cC)0 Přitom se můžeme podle íc) nahoře dopustit s pravděpodobností oí chyby prvního druhův - 87 - Existuje-li k Hq jediné alternativní hypotéza U± (platí právě jedna z nich), můžeme najít pravděpodobnost chyby druhého druhu (d), íili neoprávněného přijetí HQ: (5 = PÍt^K]^). (2) Mírou možnosti oddělit HQ a je tzv. síla (mohutnost) testu 1 - (i , která ovšem závisí na oC . Tuto souvislost objasníme v následujícím příkladu. Přiklad testu zvětšení-střední hodnoty normálního rozdělení Uvažujme o následující situaci. Měřením intenzity zdroje záření (elektromagnetického nebo svazku Částic) dostáváme náhodné výsledky x normálně rozdělené se střední hodnotou^ a disperzí 6*2. Předpokládejme, že jsme znali p, a potřebujeme rozhodnout, zda tato hodnota zůstala (hypotéza Hq) nebo se zvětšila na ^ (hypotéza H-^) po nějaké úpravě zdroje. Budeme postupovat tak, že změříme N-tici intenzit Xj,...,xN a spočteme průměr (testovací statistiku) -i N 1 = N Zľ xi> O) i=l což je podle předpokladu o rozdělení x náhodné proměnná s rozdělením NQtt0,ff /K) pokud platí HQ, respektive /řO pokud platí alternativa Hj, V obrázku 39 jsou tyto dvě hustoty schematicky nakresleny spolu s plochami, reprezentujícími chyby oC a {5 při zadané hranici kritické oblasti. S použitím distribuční funkce (4.5) dostaneme mim? = 1 -f^PP-^ ^ p^ =$r¥77ÉT^ . U> S uvážením důsledků, které má přijetí jedné z hypotéz, je třeba rozhodnout o volbě kritické hodnoty t^ (tou jsou dány pravděpodobnosti chyb prvého i druhého druhu). S rostoucím počtem naměřených hodnot se rozdělení f(t[HQ) i fítJH^) zužují a v limitě N-K» rozhodneme o platnosti jedné z hypotéz s libovolně malým rizikem chyby. Dá se ukázat, že volba průměru (3) jako testovací statistiky je v tomto případě optimální - při zadaném . o. • Takové srovnání HQ a alternativy, jaké jsme použili výše, pak nemá smysl; proti HQ stojí množina hypotéz, v níž jsou i takové, které vystihují data a libovolnou přesností. Chyba druhého druhu je v této situaci neznámá. Půjde tedy pouze o srovnáni předpovědí plynoucích z Ho s naměřenými daty - tzv, kriteria dobré shody. Ve dvou následujících odstavcích jsou popsány dva z mnoha známých testů. 20. Pearsonův test dobré shody Předpokládejme, Že z N-tice naměřených hodnot x^,...,x^ byl sestaven histogram s k sloupky (buňkami). V i-tém sloupku jsou hodnoty z intervalu {m^, Mv), jejich počet označíme n^; zřejmě platí k i=l 1 . Počty "událostí" n^ v buňkách jsou náhodné veličiny s binomickým rozděle-lením (§ 7). Jsou určeny pravděpodobnostmi p- toho, že naměřená hodnota padne do i-té buňky, neboli rozdělením měřené veličiny x: Pj^ = P ^xe(mi,Mi)]= FÍM^)-F(m^), i=l,...,k. (2) Zde je F(x) distribuční funkce náhodné proměnné x. Z hypotézy H , že se x řídí daným rozdělením, plyne kromě jiného i předpověa pravděpodobností různých počtů v buňkách histogramu. Vhodnou testovací veličinou pro srov- - 89 - nání shody předpovědi a pozorování je k Cni-Np-)2 T * H~W,- * (3) i=l 1 Hodnota T bude tím větší, Čím více se budou pozorované počty n^ lišit od očekávaných středních hodnot Np^. T je ovšem náhodné veličina (n^ jsou náhodná proměnné). Platí-li hypotéza H"o, má n.. binomické rozděle— - ní se střední hodnotou Np^, které se dá-pro větší Np^ dobře aproximovat ■ ■ ■; * normální hustotou (§ 7). Jednotlivé sčítance v (3) nejsou nezávislé, n,« '■• - splňují podmínku (1). Dá se ale ukázat, že veličina T je součtem k-1 kvadrátů nezávislých náhodných proměnných, z nichž každá má přibližně standardní normální rozdělení N(0,1). Rozdělení T je tedy přibližně %2 a k-1 stupněm volnosti. Aproximace je tím lepší, čím větší jsou očekávané počty Np^, Jako podmínka použitelnosti se obvykle uvádí Np^ 5^í nebo alespoň malý počet (ne více než 20%) intervalů s Np^ ▼ rozmezí 1 aS 5. Znalosti rozdělení T využijeme k testu hypotézy HQ pomocí následující úvahy. Je-li pozorovaná hodnota T velké, mohly nastat dva případy! HQ platí, velká hodnota vyšla náhodou; HQ neplatí, velká hodnota vyšla proto, že rozdělení dat je jiné. Rozhodneme se tedy, že H0 zamítneme, je-li hodnota T dostatečně málo pravděpodobná. Ve statistice se užívá ustáleného způsobu vyjadřování této sou-visidsti. Hypotézu Hc zamítáme na hladině významnosti o(, (nebo s rizikem ■ - - «<), jestliže vyšla hodnota T^T^,, přičemž pravděpodobnost tohoto výsledku je cí: PfT^T^) = 1-P(T některém z naměřených bodů x(l),...,x(N). DN je náhodná proměnná, které mé za předpokladu platnosti hypotézy o rozdělení F(x) asymptotickou distribuční funkci oo (z) = lim Ph/Ň"D„>z = 2 )_(-l)M exp(-2r2z2). (3) N-^co L J ^ Průběh funkce F„(z) je v obr. 41; obvykle se předpokládá, že proměnná \fŇ~Djj má asymptotické rozdělení (3) a dostatečnou přesností už při N£580, V Kolmogorovov.ě testu posuzujeme pozorovanou hodnotu \[Ň~ D^. Vy jde-li příliš velká, zamítneme hypotézu o rozdělení dat podle F(x): pro s[k~Dn > z^ , kde F^z^) - 1 - o( , (4) zamítáme hypotézu na úrovni o£ (s rizikem oO. Kritické hodnoty jsou např. z0.01= 1'63' Z0.05= 1*36' 20.1= r'22 ' C5) Test normality rozděleni dat z § 11 - měřeni Ča3u Ukážeme funkci testu v případě dat z obr. 24(§ 11). Maximální odchylka mezi empirickou distribuční funkcí a čárkovaně nakreslenou hypotetickou normální distribuční funkcí je I>200= 0.0513; "testované hodnota v/200 E>200= = 0.725 padá podle obrázku 41 do oblasti hodnot velmi pravděpodobných. Hladina významnosti pro = 0.725 je o£ = l-Fíz^) = 0.67, riziko při 0.0 0.5 1.0 1.5 2.0 Obr. 41* Distribuční funkce (21.3) Kolmogorovova kriteria. 150 200 250 300 350 Obr. 42. Empirické distribuční funkce prvních 150-ti hodnot ze souboru dat z infračerveného spektrometru (§ 2, obr. 3), plná čára. Normální distribuční funkce, čárkovaná čára. - 94 - zamítnutí hypotézy daného normálního rozdělení je příliš velké. Připomeneme ještě, 2e není možné uvažovat tak, že shoda a hypotézou je tím lepší, Cím menší je testované hodnota \/N* D^. Jde o hodnotu náhodné proměnné, která podle obr. 41 padá a velkou pravděpodobností do intervalu mezi 0.5 a 1.5; pravděpodobnost výsledku \/Ň* DN <0.25 je prakticky nulové (/^3xl0"8), Test normality dat ze spektrometru " Z tisíce hodnot použitých v příkladu X - testu v § 20 jsme vybrali prvních 150 a vypoSetli maximální odchylku empirické a hypotetické distri-buSní funkce (obr. 42): = 0.0538. Riziko při zamítnutí hypotézy o normálním rozdělení je pro z^ = \/l5b ^^0= 0,^59 zhruba 0.78, tedy nepřípustně velké. Shodu v obr. 42 posuzujeme jako velmi dobrou, pozornost může vzbudit odchylka v intervalu hodnot 300-ŕ-350. Kolmogorovňv test říká, Že odchylky takové velikosti nastávají často. 4 - 95 - Dodatky |pi. a2- rozděleni V tabulce jsou hodnoty xpt pro které je pravděpodobnost PÍx