Matematika pro radiologické asistenty 9. Pravděpodobnost 9.1 Náhodné jevy a jejich pravděpodobnost Začneme dvěma velmi známými příklady ze života: Příklad 1. Házení mincí ­ náhodný pokus: jsou celkem dvě možnosti ­ náhodné jevy (orel, hlava). Sledujeme jev A: padne orel ­ jedna z možností je příznivá, 1 2p= . Příklad 2. Házení kostkou ­ náhodný pokus: je celkem šest možností ­ náhodných jevů (1, 2, 3, 4, 5, 6). Sledujeme jev A: padne šestka ­ jedna z možností je příznivá, 1 6p= . Definice pravděpodobnosti: Pravděpodobnost nastoupení jevu A je podílem počtu případů M, v nichž jev A nastal (čitatel), a počtu N všech možných případů (jmenovatel). Příklad s jednou kostkou (všech možných případů je 6N = ): a) Jaká je pravděpodobnost, že při hodu kostkou padne sudé číslo? Příznivé jsou ty případy, kdy padne dvojka nebo čtyřka nebo šestka, tedy 3M = . Pravděpodobnost je 3 6 1 2p= = . b) Jaká je pravděpodobnost, že padne číslo dělitelné třemi? Příznivé jsou ty případy, kdy padne trojka nebo šestka, tedy 2M = . Pravděpodobnost je 2 6 1 3p= = . c) Jaká je pravděpodobnost, že padne číslo menší než tři? Příznivé jsou ty případy, kdy padne jednička nebo dvojka, tedy 2M = . Pravděpodobnost je 2 6 1 3p= = . Příklad se dvěma kostkami (všech možných případů je 36N = , každá ze 6 možností, které mohou padnout na první kostce, se nezávisle kombinuje s každou ze 6 možností na druhé kostce): a) Jaká je pravděpodobnost, že při hodu dvěma kostkami (současně) padne součet sedm? Příznivé jsou ty případy, kdy padne jednička na první a šestka na druhé kostce, nebo naopak, dvojka na první a pětka na druhé kostce, nebo naopak, trojka na první a čtyřka na druhé kostce, nebo naopak), tedy 6M = . Pravděpodobnost je 6 36 1 6p= = . b) Jaká je pravděpodobnost, že součin padnuvších čísel bude lichý? Příznivé jsou ty případy, kdy padne jednička na první kostce a jednička nebo trojka nebo pětka na druhé kostce, trojka na první kostce a jednička nebo trojka nebo pětka na druhé kostce, pětka na první kostce a jednička nebo trojka nebo pětka na druhé kostce, tedy 9M = . Pravděpodobnost je 9 36 1 4p= = . Jakých hodnot může pravděpodobnost v principu nabývat? Z definice je zřejmé, že hodnoty budou v intervalu mezi nulou a jedničkou 0 1p Krajním hodnotám odpovídají jev nemožný ­ jev s nulovou pravděpodobností a jev jistý ­ jev s jednotkovou pravděpodobností. 9.2 Kombinatorika V mnoha aplikacích provádíme výběry k prvků z množiny obsahující n prvků podle jistých pravidel. Typy pravidel jsou uvedeny v tabulce Příkladem může být vytváření barevných signálů, kdy šest barev ( 6n= ) zaplňuje tři místa ( 3k = ): Počet možných výběrů je v následující tabulce: Pro triviální případ 1n k= = máme vždy jedinou možnost (připomeňme si, že z definice 0! 1,1! 1, 2! 2 , 3! 6 , 4! 24 , 5! 120 , 6! 720 ,= = = = = = = ...). Určení vzorce pro variace opakováním: Kolika způsoby lze z n prvků vybrat první? Je to n způsobů. Kolika způsoby lze z n prvků vybrat druhý? Opět je n způsobů. Kolika způsoby lze tedy vybrat první dva prvky? Je to 2 n n n = způsobů. Pokračujeme až k otázce kolika způsoby lze vybrat k prvků? Je to k k n n n n =" #$%$& způsobů. Určení vzorce pro variace bez opakování: Kolika způsoby lze z n prvků vybrat první? Je to n způsobů. Kolika způsoby lze ze zbývajících 1n- prvků vybrat druhý? Je to 1n- způsobů. Kolika způsoby lze tedy vybrat první dva prvky? Je to ( )1n n - způsobů. Pokračujeme stejně až nakonec, kdy se ptáme kolika způsoby lze ze zbývajících ( )1n k- - prvků vybrat k-tý? Je to 1n k- + způsobů. Kolika způsoby lze tedy vybrat k prvků? Je to ( ) ( ) ( )1 2 1n n n n k - - - +" neboli ( )! !n n k- prvků. Určení vzorce pro kombinace bez opakování: Zatímco pro variace bylo pořadí vybraných prvků podstatné, pro kombinace je podstatný pouze výběr těchto prvků. Musíme proto počet způsobů pro variace podělit tím, kolika způsoby lze uspořádat k neopakujících se prvků, což je !k Proto je ( ) ( ) ( ) ! ! ! ! k k V n n C n k k n k = = Určení vzorce pro kombinace s opakováním: Jak vypadají kombinace s opakováním k barevných kuliček při výběru z n možných barev? Obrázek ilustruje jednu z možností pro případ 7n= , 14k = . Obecně dostaneme počet kombinací takto: máme n přihrádek, tj. 1n- přepážek mez nimi a k kuliček, celkem tedy 1m n k= + - prvků (pozic), z nich vybíráme k pozic pro kuličky, tj. ( ) ( ) ( ) ( ) ( ) / 1 !! ! ! ! 1 ! k k n km C n C m k m k k n + = = = - - Při variacích nebo kombinacích bez opakování musí být přirozeně k n (,,vybraný prvek nevracíme do losování"). Pro 1k = jsou samozřejmě počty možností ,,s opakováním" ­ žádné totiž není a ,,bez opakování" stejné, pro 1n k > je ( ) ( )/ k kV n V n< a ( ) ( )/ k kC n C n< . Příklad 1. Jaká je pravděpodobnost hlavní výhry ve Sportce? Tah sportky představuje výběr šesti ze čtyřiceti devíti čísel. ( ) 8 6 49! 49 , 1 , 7 10 6!43! M N C M p N = = = = ' Příklad 2. Jaká je pravděpodobnost páté ceny ve Sportce? Ze šesti tažených je třeba uhodnout tři čísla. ( ) ( ) ( )6 3 3 49! 6! 43! 49 , 6 43 , 0,018 6!43! 3!3!3!40! M N C M C C p N = = = = = ' Příklad 3. Jaká je pravděpodobnost, že ve hře typu Šance milion uhodnete správně taženou skupinu cifer? (Z každého ze šesti bubnů obsahujících cifry 0, 1, 2, . , 9 se náhodně vybere jedna.) ( )/ 6 6 6 10 10 , 1 , 10 M N V M p N = = = = = 9.3 Pravděpodobnosti složených jevů Někdy je třeba určit pravděpodobnosti jevů, které jsou nějakým způsobem ,,složeny" z jevů jednodušších. Uvažujme o dvou jevech A a B, jejichž pravděpodobnosti jsou známy, ( )p A a ( )p B . Definujme nové jevy C a D jako: jev C je jev, kdy jevy A a B nastanou současně, jev D je jev, kdy nastane jev A nebo B (v principu zahrnuje i možnost, že nastanou oba). Za určitých podmínek lze pravděpodobnosti jevů C a D určit pomocí pravděpodobností ( )p A a ( )p B . Nezávislé jevy Jaká je pravděpodobnost, že při současném hodu dvěma kostkami padne na obou šestka? Uvědomíme si, že to, co padne na jedné kostce, je nezávislé na výsledku druhé kostky. Máme tedy jev A, kdy na první kostce padne šestka ­ ( ) 1 6p A = a jev B, kdy na druhé kostce padne šestka ­ ( ) 1 6p B = . Jev C pak odpovídá tomu, že jevy A a B nastanou současně. Máme 6 6 36N = = možností a právě jeden příznivý případ 1M = . Je tedy ( ) ( ) ( ) 1 1 1 36 6 6 M p C p A p B N = = = = Pravděpodobnost současného nástupu nezávislých jevů je rovna součinu pravděpodobností těchto jevů. Neslučitelné jevy Jaká je pravděpodobnost, že při hodu kostkou padne některé ze dvou nejvyšších čísel, tj. padne šestka nebo pětka? Uvědomíme si, že skutečnosti, že šestka i pětka padnou při stejném hodu, jsou neslučitelné. Máme tedy jev A, kdy na kostce padne šestka ­ ( ) 1 6p A = a jev B, kdy na kostce padne pětka ­ ( ) 1 6p B = . Jev C pak odpovídá tomu, že nastane buď jev A nebo jev B. Máme 6N = možností a dva příznivé případy 2M = . Je tedy ( ) ( ) ( ) 2 1 1 6 6 6 M p C p A p B N = = = + = + Pravděpodobnost nástupu některého z jevů, z nichž každé dva jsou neslučitelné, je rovna součtu pravděpodobností těchto jevů. Označíme-li pravděpodobnost jevu A ( )p A , je pravděpodobnost jevu opačného A (tj. jev A nenastane) p A( ) ( )1 p A= - . Pro součet pravděpodobností jevu A a opačného jevu A platí ( )p A p A+ ( ) 1= Příklad 4. Jaká je pravděpodobnost, že ve skupině k osob mají alespoň dvě narozeniny ve stejný den? Rok má 365n= dní. Určíme nejprve pravděpodobnost jevu A, že každá z osob má narozeniny v jiný den. Počet případů možných pro tento jev je ( )/ kV n (variace s opakováním ­ v principu může mít každá z osob narozeniny v kterýkoli den). Počet případů příznivých je ( )kM V n= (variace bez opakování ­ nechceme, aby se narozeninový den zopakoval u více osob). Jev, který nás zajímá, je opačným jevem k jevu A, jeho pravděpodobnost je tedy p A( ) ( ) ( ) ( ) ( )/ ! 1 1 1 ! k k k V n n p A V n n k n = - = - = - Je-li ve skupině pouze jeden člověk ( 1k = ), nemohou připadnout dvoje narozeniny na stejný den ­ skutečně dostáváme v tomto případě p A( ) 1 1 0= - = . Pro skupinu například 40 osob je pak p A( ) 1 0,11 0,89- =' , tedy skoro 90%. Bernoulliův pokus Nejprve zavedeme pojmy a značení. Nastane-li předem definovaný jev A (například ,,padne šestka"), nazveme to zdarem, v opačném případě nezdarem. Pravděpodobnost zdaru označíme p (v příkladu s kostkou p = 1/6), pravděpodobnost nezdaru je 1 p- (v příkladu s kostkou tedy 5/6). n-krát nezávisle provedeme pokus (například hod kostkou). Bude nás zajímat jev B, kdy právě při x provedeních z celkového počtu n provedení pokusu nastane zdar. S touto základní situací souvisí další jevy ­ jev Aj, kdy pro 1,2, ,j x= ... nastane zdar při j-tém provedení pokusu, jev Bk, kdy pro 1, 2, ,k x x n= + + ... nastane při k-tém provedení pokusu nezdar a konečně jev C, kdy jevy A1 až Ax a jevy Bx+1 až Bn nastoupí současně, tj. právě při prvních x opakováních pokusu nastane zdar, při zbývajících nezdar. Pravděpodobnost jevu C spočteme snadno jako součin pravděpodobností nezávislých jevů (například hodů kostkou) ( ) ( ) ( ) ( ) ( ) ( )1 1 1 n xx x x np C p A p A p B p B p p += = -" " Pro pravděpodobnost jevu B nám ale nezáleží na tom, v jakém pořadí došlo k požadovaným x zdarům ze všech n opakování pokusu. Možností, kdy zdar nastal právě při x ze všech n opakování pokusu, je (kombinace) ( ) ( ) ! ! ! x nn C n xx n x = - Výsledná pravděpodobnost jevu B je tedy ( )xC n -krát větší než pravděpodobnost jevu C, tj. ( ) ( ) ( ) ( ) ( ) ! 1 ! ! n xx x n p B C n p C p p x n x = = - Na obrázcích je závislost pravděpodobnosti jevu B na x při n hodech mincí pro 3n= a 10n= . Někoho možná překvapí, že při zvyšujícím se n se pravděpodobnost stejného počtu zdarů a nezdarů (pro 10n= je to při 5x= ) neblíží jedné polovině, ale klesá. Je to proto, že počítáme pravděpodobnost, kdy je počet zdarů a nezdarů přesně stejný. Při velkých hodnotách n pak rozdíl třeba o jedničku nebo dvojku v počtech zdarů a nezdarů má téměř stejnou pravděpodobnost jako když jsou počty stejné, jak vidíme z obrázku už při poměrně malém 10n= je pravděpodobnost pro 4x= a 6x= jen o málo menší než maximální pro 5x= . 10. Měření a zpracování dat 10.1 Měřené hodnoty veličin jsou ,,náhodné" Uvozovky v nadpisu jsou upozorněním na to, že při měření (ať už je jeho podstatou cokoliv) závislosti hodnoty měřené veličiny (závisle proměnná) na hodnotách jiné veličiny (nezávisle proměnná) se mohou uplatňovat také náhodné vlivy, nikoliv snad to, že ,,naměříme cokoliv". Tedy za stejných podmínek (tj. při stejných hodnotách nezávisle proměnných veličin) můžeme dostat při opakovaných měřeních různé hodnoty měřené veličiny (závisle proměnné). Základem pro matematický popis této situace je pojem náhodné veličiny. 10.2 Náhodná veličina s diskrétním rozdělením Náhodná veličina X a její (diskrétní) rozdělení je veličina, která nabývá hodnot ( )0 1, , , nx x x... s pravděpodobnostmi ( )0 1, , , np p p... . Protože jevy, kdy veličina X nabývá dvou různých hodnot jx současně jsou neslučitelné, musí být 0 1 1np p p+ + + =" . Rozdělením náhodné veličiny rozumíme soubor všech dvojic( ),j jx p pro 0,1, ,j n= ... . V části o pravděpodobnosti jsme se setkali s výrazem pro Bernoulliovo rozdělení ( ) ( ) ! , 1 , 0 1 , 0,1, , ! ! n jj j j n x j p q q q j n j n j = = - = - ... Samozřejmě platí pro součet pravděpodobností ( ) ( ) 0 0 1 1 1 n n nn jj j j j n p q q q q j = = = - = - + = V případě, že pravděpodobnost zdaru a nezdaru v jednom pokusu je stejná ( 1 2q = ) dostáváme binomické rozdělení ( ) 1 ! , , 0,1, , 2 ! ! j j n n x j p j n j n j = = = - ... Na obrázku je Bernoulliovo rozdělení pro 120n= a dvě hodnoty q: 1 6q= (házení kostkou, červeně) a 1 2q= (házení mincí, modře) ­ pro lepší viditelnost jsou body spojeny plnou křivkou. Maximum je v obou případech u střední hodnoty j qn= (střední hodnotu definujeme dále), tj. 20j = pro házení kostkou a 50j = pro házení mincí. Na příkladu střelce, který vystřelí n-krát na terč si ukážeme, jak zjistit rozdělení experimentálně. Dosažené počty bodů při jednotlivých výstřelech představují hodnoty náhodné veličiny. Jaké jsou pravděpodobnosti jednotlivých hodnot? Pro n = 50 například: Při různých počtech výstřelů n se pravděpodobnosti budou obecně měnit. Pro rostoucí n budeme pozorovat jejich ,,ustalování". Která hodnota nejlépe reprezentuje rozdělení? Náhodnou veličinu samozřejmě nejdokonaleji reprezentuje zadání jejího rozdělení. To je ovšem poněkud nepraktické. U střelce jsme viděli, že jeho kvalita je reprezentována hodnotou blízkou devítce. Realizovala se nejčastěji, má největší váhu. Vhodnější reprezentativní hodnotou bude aritmetický průměr všech hodnot včetně ,,násobnosti" 10 10 0 1 10 0 00 1 10 0 1 10 8,12 50 j j j j nn n n j j p j n n n = = + + + = = = = + + + " " Obecně pak 0 0 , 1 n n j j j j j x p x p = = = = Takto definovaná hodnota x je váženým průměrem jednotlivých hodnot a nazývá se střední hodnotou náhodné veličiny. Výpočet střední hodnoty náhodné veličiny, která má Bernoulliovo rozdělení není komplikovaný: ( ) ( ) ( ) ( ) ( ) ( ) ( )1 11 0 1 1 !! 1 1 ! ! 1 ! 1 1 ! n n n j n jj j j j nn j j q q nq q q j n j j n j - - - -- = = = - = - - - - - a s označením 1, 1i j m n= - = - pak ( ) ( ) ( ) 0 ! 1 1 ! ! m m i mi i m j nq q q nq q q nq i m i - = = - = - + = - Před zavedením další charakteristiky rozdělení uvedeme další příklad, tentokrát se dvěma střelci, z nichž každý vystřelí n-krát na terč. Zvolme opět 50n= : Na obrázku jsou zobrazena rozdělení obou střelců (pro prvého bílými, pro druhého modrými sloupečky). Výpočtem zjistíme, že oba dosáhli střední hodnoty 5. Čím se tedy jejich výsledky liší? Je to rozptyl nebo z něho vypočtená směrodatná odchylka. Jak se k této charakteristice dostaneme? Uvažujme náhodnou veličinu ( )Y f X= . Má-li veličina X rozdělení ( ),j jx p , má veličina Y rozdělení ( ) ( )( ), ,j j j jy p f x p= . Jaká veličina by tedy mohla charakterizovat ,,odchýlení" hodnot od střední hodnoty? Nejjednodušší možnost Y X x= - není vhodná, protože pro libovolné rozdělení je 0y = : ( ) 0 0 0 0 0 n n n n j j j j j j j j j j j y y p x x p x p x p x x = = = = = = - = - = - = Takže musíme vzít náhodnou veličinu ( ) 2 Y X x= - . Střední hodnotu této veličiny nazýváme rozptylem ( ) ( ) 2 D X X x= - . Provedeme-li umocnění, máme pro rozptyl ( ) 2 22 2 2D X X X x x X x= - + = Odmocnina z rozptylu (jak vidět z definice rozptyl je vždy kladný) je tzv. směrodatná odchylka ( ) ( ) 22 X D X X x = = Pro úplnost příkladu dodejme, že směrodatná odchylka vyjde 1,7 pro prvého a 1,2 pro druhého střelce. Pro Bernoulliovo rozdělení je ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 1 12 2 1 0 1 1 1 1 2 12 1 0 1 22 2 2 1 !! 1 1 ! ! 1 ! 1 1 ! 1 1 ! 2 ! 1 1 1 ! 1 ! 1 ! 2 1 ! 2 ! 1 1 1 ! 2 ! n n n j n jj j j j n n n i n ii i i i n kk j nn j j q q nq q q j n j j n j i n n nq q q nq n n q q q i n i i n i n nq n n q q q nq n n q n k n k - - - -- = = - - - - - -- = = - - = - = - = - - - - - + - - = + - - - - - - - = + - - = + - = - - ( ) 2 2 1 n k o q nq q - = + Rozptyl Bernoulliova rozdělení je tedy ( ) ( ) 22 1D j j j n p p= - = Distribuční funkci ( )F x definujeme na reálné ose ( součtem pravděpodobností 0 sp p+ +" odpovídajících hodnotám menším než 1sx + ( ) 0 0 0 1 1 0 0 0 1 s j s s j n j n j x x p x x x p x x xF x p x x + = = < < <= = ) ) ) ) Naopak pravděpodobnosti dostaneme jako ( ) ( ) ( )0 0 1, 1j j jp F x p F x F x j n-= = - Medián rozdělení je taková hodnota sx , pro kterou ( ) 0,5sF x < a ( )1 0,5sF x + . Pro n a j malé přejde Bernoulliovo rozdělení na Poissonovo rozdělení. Upravujeme tedy ( ) ( ) ( ) ! ! lim 1 lim lim 1 ! ! ! ! 1 nj n jj j jn n n j j jn n p q q j n j j nj n n j n - = - = - - - - Využijeme vztahů platných pro n a j malé: ( )! 1 !j n n n - , ( )1 1 j j n- a definice ( ) ( )exp lim 1 n n j j n - = - . Dostáváme tak Poissonovo rozdělení ( )exp ! j j j p j j = Poissonovo rozdělení se projeví třeba tehdy, sledujeme-li časový průběh počtu produktů radioaktivního rozpadu: počítáme částice detekované v nějakých časových intervalech, ale ty tvoří jen nepatrnou část částic v těchto intervalech vzniklých při rozpadu radioaktivních jader zdroje. 10.3 Náhodná veličina se spojitým rozdělením Náhodná veličina X, která nabývá všech reálných hodnot x z intervalu [ ],m Mx x má (spojité) rozdělení dané funkcí ( )w x na tomto intervalu s vlastnostmi ( ) ( )0 , 1 M m x m M x w x x x x w x d x = Funkci ( )w x se také říká hustota pravděpodobnosti, neboť elementární pravděpodobnost (tj. pravděpodobnost, že veličina X má hodnotu v intervalu [ ],x x d x+ ) je ( )d p w x d x= . Také pro náhodnou veličinu se spojitým rozdělením můžeme definovat střední hodnotu, směrodatnou odchylku, distribuční funkci a medián: ( ) ( ) ( ) ( ) ( ) ( ) 2 , , 0,5 M M m m m x x x x x MED x x x w x d x x x w x d x F x w d F x = = = = Důležitým příkladem je normální neboli Gaussovo rozdělení na celé reálné ose, tj. ( ),x - : ( ) 2 2 1 exp 22 x w x = - Veličina skutečně vyjadřuje standardní odchylku, platí ( ) 2 0 ,x D X = = Na obrázku je Gaussovo rozdělení pro 1 = (modrá křivka), 2 = (červená křivka) a 3 = (zelená křivka). Předpokládejme, že existuje nějaká ,,správná" hodnota měřené veličiny x a že při opakovaném měření získáme hodnoty ( )0 1, , , nx x x... , některé mohou být i stejné. Odchylky od (zatím neznámé) správné hodnoty označme ( )0 1, , , n ... . Tyto hodnoty jsou hodnotami náhodné veličiny E. Její hustotu pravděpodobnosti označme ( )w E . Za jistých podmínek je rozdělením veličiny E rozdělení normální. Předpokládejme, že odchylky jsou způsobeny m nezávislými vlivy, každý z nich odchýlí měřenou hodnotu od x o stejnou hodnotu , kladnou nebo zápornou, s pravděpodobností 1 2. Kladnou odchylku ( + ) nazveme zdarem, zápornou ( - ) nezdarem. Výsledná odchylka naměřené hodnoty od x leží v intervalu ( ),m m - a může nabývat pouze celých násobků . Pravděpodobnost odchýlení o j kladných a m j- záporných vlivů (j zdarů a m j- nezdarů), tj. pravděpodobnost vzniku odchylky ( )( )j m j = + - - , tj. ( )2 j m = - je dána binomickým rozdělením (Bernoulliovým pro 1 2q= ) ( ) 1 ! 2 ! ! j m m p j m j = Pro velká m je lze nahradit rozdělením normálním (Gaussovým) ­ důkaz naznačíme na konci kapitoly. Předpoklad o normální rozdělení umožňuje následující zpracování výsledků: reprezentativní hodnota měření představuje aritmetický průměr všech naměřených hodnot (střední hodnota veličiny) ( )1 2 1 nx x x x n = + + +" (číslujeme teď měření od jedničky, nikoliv od nuly). Tento aritmetický průměr neurčuje správnou hodnotu veličiny. Lze však tvrdit, že s pravděpodobností 68,3% tato správná hodnota leží v intervalu určeném aritmetickým průměrem a směrodatnou odchylkou příslušnou aritmetickému průměru ( ),x x x - + což zapisujeme také takto x x = Směrodatnou odchylku aritmetického průměru počítáme pomocí odchylek od aritmetického průměru jako ( ) ( ) ( ) ( ) 2 2 22 1 2 1 1 nx x x x x x n n = - + - + + - - ... Jen pro zajímavost uveďme, že pokud bychom chtěli psát výraz pomocí odchylek od skutečné hodnoty (to však z praktického hlediska nemá smysl, skutečnou hodnotu neznáme), měl by výraz tvar ( ) ( ) ( ) 2 2 22 1 22 1 nx x x x x x n = - + - + + - ... Vezmeme-li interval daný tzv. krajní chybou (trojnásobek směrodatné odchylky), pak skutečná hodnota měřené veličiny se v tomto intervalu nachází s pravděpodobnostní 97%. 10.4 Jaký průměr? Příklad 1. Student měl ze tří matematických písemek v semestru tři hodnocení B a jedno C. U dvou závěrečných písemek měl A a D, u ústní zkoušky E. Jaká je jeho průměrná známka, jestliže všechny známky mají stejnou váhu? Označíme jz hodnoty, jn jejich četnosti a jw váhy. Obecný vztah pro vážený průměr je 1 1 n j j j j n j j j z n w z n w = = = V našem případě jsou všechny váhy stejné, potom se výraz zjednoduší na 1 1 n j j j n j j z n z n = = = Máme tedy 1,5 3 2 1 1 1 2,5 1 3 1 13 1,86 C 3 1 1 1 1 7 z + + + + = = = + + + + ...... Příklad 2. Řešte předchozí příklad za předpokladu, že závěrečná písemka má dvakrát větší váhu než průběžná a ústní zkouška má dvakrát větší váhu ne. závěrečná písemka: 1,5 3 1 2 1 1 1 1 2 2,5 1 2 3 1 4 25,5 2,12 C 3 1 1 1 1 2 1 2 1 4 12 z + + + + = = = + + + + ...... Příklad 3. Automobil jel z A do B první úsek rychlostí 130 km/h a stejnou dobu druhý úsek průměrnou rychlostí 70 km/h. Jaká byla jeho průměrná rychlost na celé trase? Je odpověď dána aritmetickým průměrem obou hodnot? Je to věc definice. Průměrná je definována jako podíl celkové dráhy a celkové doby jízdy. Dráhu ale neznáme. Víme však, že oba úseky trvaly stejně času. V takovém případě by bylo 1 2 1 2 1 2 1 2 100km/h 2 2 s s v t v t v v v t t t + + + = = = = + Takže přece jen aritmetický průměr? Zkusme úlohu obměnit. Příklad 4. Automobil jel z A do B první úsek rychlostí 130 km/h a druhý úsek rychlostí 70 km/h. Oba úseky byly stejně dlouhé. Jaká byla nyní průměrná rychlost? 1 2 1 2 1 2 1 2 1 2 1 2 22 2 91km/h 1 1 s s v vs v s st t v v v v v v + = = = = = + ++ + Jedná se o tzv. harmonický průměr. Příklad 5. ,,Průměrný" obdélník je čtverec (určete stranu čtverce, který má stejný obsah jako obdélník o stranách a a b), ,,průměrný" elipsoid je koule (určete poloměr koule, která má stejný objem jako elipsoid o poloosách a , b , c): V prvním případě máme pro stranu čtverce 2 P ab x x ab= = = a v druhém případě pro poloměr koule 3 3 4 4 3 3 V abc x x abc = = = V obou případech se jedná o tzv. geometrický průměr. Pro obecný počet n hodnot máme následující výrazy pro výpočet průměru: aritmetický průměr 1 2 n a x x x x n + + + = " geometrický průměr 1 2 n ng x x x x= ... harmonický průměr 1 2 1 1 1h n n x x x x = + + +" Platí nerovnost a g h x x x Pro 2n= je to hned vidět (napišme nerovnosti pro druhé mocniny průměrů) ( ) ( ) ( ) ( ) 2 2 2 2 21 2 1 2 1 2 1 2 1 2 22 2 2 2 2 21 21 2 1 2 1 2 1 22 2 1 1 2 2 1 0 4 4 4 2 4 a g g h x x x x x x x x x x x x x xx x x x x x x x x x x x x x + + - = - + + + 10.5 Přechod od Bernoulliova ke Gaussovu rozdělení Bernoulliovo rozdělení je ( ) ( ) ! , 1 , 0 1 , 0,1, , ! ! n jj j j n x j p q q q j n j n j = = - = - ... Logaritmus pravděpodobnosti je ( ) ( ) ( ) [ ]( ) ( ) ( ) ( )ln ln ! ln ! ln ! ln ln 1jp n j n j j q n j q= - - - + + - Stejně jako při přechodu k Poissonovu rozdělení předpokládáme n , ale teď budeme předpokládat, že počet zdarů a nezdarů se nebude příliš lišit, tj. také j a n j- jsou velká čísla. Základem pro výpočet bude přibližné vyjádření ( ) ( ) 1 ln ! ln k r k r = = (logaritmus součinu je roven součtu logaritmů součinitelů) pro velké hodnoty k. Protože logaritmus je monotónně rostoucí funkce, můžeme napsat nerovnost, kdy integrál z logaritmu na intervalu jednotkové délky je větší než hodnota logaritmu ve spodní mezi a menší než hodnota logaritmu v horní mezi ( ) ( ) ( ) 1 1 ln ln ln rr r r d r d + < < Sečtením přes r od 1r = do r k= dostáváme ( ) ( ) ( ) ( ) ( ) ( ) 1 0 1 ln ln ln ! ln 1 ln 1 kk d k k k k d k k k + < - < < = + + - neboť ( ) ( )ln lnx d x x x x= - . Na obrázku vidíme, proč už pro relativně malé hodnoty můžeme sumaci ( )lnj j nahradit integrací ( )ln x d x ­ tedy diskretní proměnnou j spojitou proměnnou x. Za hodnotu ( )ln !k bychom mohli vzít průměr z obou krajních hodnot v nerovnosti, my vezmeme ještě o něco lepší aproximaci, zvanou Stirlingova formule (její odvození už je však trochu komplikovanější) ( ) ( ) ( ) 1 1 ln ! ln ln 2 2 2 k k k k + - - ' Pro logaritmus pravděpodobnosti budeme teď mít ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ln 1 1 1 1 ln 2 ln ln ln ln ln 1 2 2 2 2 P x p x n n x x n x n x x q n x q = = - + + - + - - + - + + - - Maximum hustoty pravděpodobnosti bude u takové hodnoty x, pro kterou je derivace funkce ( )p x (a tedy i jejího logaritmu) rovna nule. Dostáváme tak rovnici ( ) ( ) ( ) 1 1 1 ln 0 1 2 d P x q n x d x q x n x x - = + - = - - Pro druhou derivaci máme vztah ( ) ( ) 2 22 2 1 1 1 1 1 2 d P x d x n x x xn x = - + + + - - První derivace je rovna nula pro hodnotu x, která je přibližně (pro 1 2q= přesné) rovna střední hodnotě x x nq= = . Ve stejném přiblížení máme ( ) ( ) ( )2 2 2 2 1 1 ln 2 , , 2 d P x P x d x = - = kde je směrodatná odchylka ( )2 1nq q = - . Vezmeme-li teď první členy Taylorova rozvoje ( )P x kolem x x= , dostáváme ( ) ( ) ( ) 22 2 1 1 ln 2 2 2 P x x x = - - a po odlogaritmování dostáváme skutečně Gaussovo rozdělení se středem v x x= ( ) ( ) 2 2 1 exp 22 x x p x - = - Na obrázcích je porovnáno binomické rozdělení s normálním rozdělením pro 25n= (vlevo) a 50n= (vpravo).