VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ FAKULTA ELEKTROTECHNIKY A KOMUNIKAČNÍCH TECHNOLOGIÍ ÚSTAV MATEMATIKY Matematika 3 Sbírka úloh z pravděpodobnosti Irena Hlavičková Dana Hliněná Ústav matematiky FEKT VUT v Brně, 2015 http://www.umat.feec.vutbr.cz 1 Obsah Úvod 3 1 Základy popisné statistiky 4 1.1 Základní pojmy a řešené příklady . . . . . . . . . . . . . . . . . . . . . . . 4 1.2 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 10 2 Základy kombinatoriky 12 2.1 Základní pojmy a řešené příklady . . . . . . . . . . . . . . . . . . . . . . . 12 2.2 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 20 3 Klasická a podmíněná pravděpodobnost 23 3.1 Základní pojmy a řešené příklady . . . . . . . . . . . . . . . . . . . . . . . 23 3.2 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 35 4 Diskrétní náhodná veličina 42 4.1 Základní pojmy a řešené příklady . . . . . . . . . . . . . . . . . . . . . . . 42 4.2 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 53 5 Spojité náhodné veličiny 59 5.1 Základní pojmy a řešené příklady . . . . . . . . . . . . . . . . . . . . . . . 59 5.2 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 72 6 Významná diskrétní rozdělení pravděpodobnosti 80 6.1 Příklady na samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . . 92 7 Exponenciální a Poissonovo rozdělení pravděpodobnosti 96 7.1 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 101 8 Normální rozdělení 103 8.1 Základní pojmy a řešené příklady . . . . . . . . . . . . . . . . . . . . . . . 103 8.2 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 110 8.3 Aproximace binomického rozdělení normálním rozdělením . . . . . . . . . . 112 8.4 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 117 2 9 Statistické testy 120 9.1 Základní pojmy a řešené příklady . . . . . . . . . . . . . . . . . . . . . . . 120 9.2 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 127 9.3 Test hypotézy o střední hodnotě normálního rozdělení . . . . . . . . . . . . 128 9.4 Příklady pro samostatnou práci . . . . . . . . . . . . . . . . . . . . . . . . 131 Tabulka hodnot distribuční funkce normálního rozdělení 133 3 Úvod Tento učební text by měl sloužit jako doplněk ke skriptům Matematika 3. Na začátku každé kapitoly jsou vždy zopakovány základní pojmy a vzorce vztahující se k probírané tématice. Vždy je předvedeno několik podrobně řešených příkladů, pak následují příklady pro samostatnou práci. Při přípravě této sbírky jsme vycházely ze zkušeností z cvičení předmětu BMA3. Snažíme se upozorňovat na chyby, kterých se studenti často dopouštějí, a ukazovat cestu k jejich nápravě. Doufáme, že naše sbírka jednak pomůže studentům lépe pochopit probíranou látku a jednak že bude užitečným pomocníkem při přípravě na zkoušku. Budeme čtenářům vděčné za jakékoli věcné připomínky, upozornění na případné chyby a náměty pro zdokonalení. Autorky, březen 2015 4 Základy popisné statistiky 1 Základy popisné statistiky 1.1 Základní pojmy a řešené příklady Následující odstavec je tu víceméně ze zoufalství. Bohužel se ukazuje, že stále více studentů má potíže s pochopením vět typu: „Alespoň 3 mají vlastnost tu a tu. V příkladech z pravděpodobnosti a statistiky se podobné formulace vyskytují poměrně často, a proto stručně připomeneme základní názvosloví. Slovní vyjádření rovností a nerovností X je právě n X = n, tj. přesně n, ani více, ani méně X je více než n X > n X je alespoň n X ≥ n, tj. n nebo více X je méně než n X < n X je nanejvýš n X ≤ n, tj. n nebo méně Příklad 1.1. V následující tabulce je seznam zahrádkářů, vždy jméno a rozloha pozemku v metrech čtverečních. Beneš 1 200 Horáčková 500 Růžička 700 Černá 700 Kučera 800 Svobodová 1 000 Doležal 1 000 Moravčík 1 500 Veselý 1 800 Dvořák 900 Novák 900 Zeman 2 000 Fiala 1 100 Procházková 800 Žák 500 a) Kteří zahrádkáři mají pozemek o rozloze právě 1 000 m2 ? b) Kolik zahrádkářů má pozemek o rozloze alespoň 1 000 m2 ? c) Kolik zahrádkářů má pozemek o rozloze větší než 1 000 m2 ? d) Kteří zahrádkáři mají pozemek o rozloze menší než 700 m2 ? e) Kolik zahrádkářů má pozemek o rozloze nanejvýš 700 m2 ? Řešení. a) Pozemek o rozloze právě 1 000 m2 mají Doležal a Svobodová. b) Pozemek o rozloze alespoň 1 000 m2 má 7 zahrádkářů (Beneš, Doležal, Fiala, Moravčík, Svobodová, Veselý a Zeman). c) Pozemek o rozloze větší než 1 000 m2 má 5 zahrádkářů (Beneš, Fiala, Moravčík, Veselý a Zeman). 1.1 Základní pojmy a řešené příklady 5 d) Pozemek o rozloze menší než 700 m2 mají Horáčková a Žák. e) Pozemek o rozloze nanejvýš 700 m2 mají 4 zahrádkáři (Černá, Horáčková, Růžička a Žák). A teď už opravdu k popisné statistice: Četnosti Předpokládejme, že v souboru o rozsahu n může sledovaný znak x nabývat k různých hodnot (variant) x1, x2, . . . , xk. Četnost varianty xi je počet výskytů této hodnoty ve sledovaném souboru a označíme ji ni, i = 1, . . . , k. Pak platí n1 + n2 + · · · + nk = n. Relativní četnost varianty xi zavedeme jako fi = ni n . Pro relativní četnosti platí f1 + · · · + fk = n1 n + · · · nk n = n1 + · · · + nk n = 1. Relativní četnost se často vyjadřuje v procentech. Kumulativní četnosti (opět absolutní nebo relativní) udávají, kolik jednotek má hodnotu znaku menší nebo rovnou vybrané variantě xi. Pro spojité znaky, které mohou nabýt jakékoli hodnoty z určitého intervalu, sestavujeme intervalové rozdělení četností – stanovujeme počty výskytů hodnot znaku, které náleží do předem vymezených intervalů. Počet intervalů, do kterých hodnoty rozdělíme, můžeme volit zhruba √ n nebo 1 + log2 n . = 1 + 3,3 log n. Aritmetický průměr Máme-li soubor rozsahu n a zjištěné hodnoty znaku jsou x1, . . . , xn, pak jejich aritmetický průměr je x = x1 + · · · + xn n = 1 n n i=1 xi. Jestliže známe četnosti výskytu jednotlivých hodnot znaku, můžeme aritmetický průměr vypočítat jako x = 1 n k i=1 xi · ni = k i=1 xi · fi. (1.1) Modus Modus je hodnota, která se v souboru vyskytuje nejčastěji, označíme ji ˆx. 6 Základy popisné statistiky Medián Medián je prostřední hodnota ze souboru uspořádaného podle velikosti. Označíme jej ˜x nebo též ˜x0,5. Označíme-li prvky uspořádané podle velikosti jako x1, x2, . . . , xn a počet prvků n je liché číslo, medián je prostřední hodnota, ˜x = x(n+1)/2 . Je-li rozsah souboru n sudé číslo, je medián průměr ze dvou prostředních prvků, ˜x = 1 2 xn/2 + x(n/2)+1 . Kvantily Pro p ∈ (0, 1) je kvantil ˜xp neboli p-kvantil takové číslo, které odděluje nejmenších p · 100 % hodnot statistického znaku od největších (1 − p) · 100 % hodnot. Speciálně 0,5-kvantil je medián, 0,25-kvantil je dolní kvartil a 0,75-kvantil je horní kvartil. Aritmetický průměr, modus a medián patří mezi charakteristiky polohy. Často je ale důležité vědět, jak jsou hodnoty statistického souboru rozptýlené. Zajímá nás, jestli se znak pohybuje nejčastěji jen v určitém nevelkém intervalu, nebo zda je jeho rozpětí široké. K popisu těchto vlastností slouží charakteristiky variability: Variační rozpětí je rozdíl největší a nejmenší hodnoty znaku: R = xmax − xmin. Mezikvartilové rozpětí je rozdíl třetího a prvního kvartilu: ˜x0,75 − ˜x0,25. 1.1 Základní pojmy a řešené příklady 7 Rozptyl statistického znaku v populaci označíme σ2 a definujeme jej jako σ2 = 1 n n i=1 (xi − x)2 . (1.2) Rozptyl udává, jak se hodnoty statistického znaku průměrně liší od průměrné hodnoty, ovšem ve druhé mocnině. Výsledek je proto ve čtvercích použité měrné jednotky, což ztěžuje jeho interpretaci. Abychom se dostali zpátky na původní jednotky, rozptyl odmocníme, čímž získáme tzv. směrodatnou odchylku: Směrodatná odchylka σ je odmocnina z rozptylu: σ = √ σ2 = 1 n n i=1 (xi − x)2. Výběrový rozptyl Jestliže nemáme k dispozici data pro celou populaci, ale pouze pro vybraný vzorek, pro odhad rozptylu se používá výběrový rozptyl, který značíme s2 a je definován jako s2 = 1 n − 1 n i=1 (xi − x)2 . (1.3) Výběrová směrodatná odchylka se značí s a je to odmocnina z výběrového roz- ptylu, s = √ s2 = 1 n − 1 n i=1 (xi − x)2. (1.4) Výpočet rozptylu je jednodušší, použijeme-li vztah s2 = 1 n − 1 n i=1 x2 i − n n − 1 x2 . (1.5) Příklad 1.2. 15 optických kabelů bylo testováno na pevnost v tahu. Byly zjištěny následující hodnoty (v N): 487, 530, 507, 499, 507, 498, 499, 515, 514, 514, 507, 488, 507, 516, 505. 8 Základy popisné statistiky Vypočítejte aritmetický průměr, výběrový rozptyl a výběrovou směrodatnou odchylku. Dále určete medián. Řešení. Aritmetický průměr je x = 1 15 (487 + 530 + 507 + · · · + 505) = 506,2. Výběrový rozptyl bychom mohli počítat jako s2 = 1 14 ((487 − 506,2)2 + · · · + (505 − 506,2)2 ), ale méně pracný je výpočet pomocí (1.5): s2 = 1 14 (4872 + 5302 + · · · + 5052 ) − 15 14 506,22 . = 124,03. Výběrová směrodatná odchylka je pak s = √ s2 . = 11,14. K určení mediánu je zapotřebí hodnoty uspořádat podle velikosti: 487, 488, 498, 499, 499, 505, 507, 507, 507, 507, 514, 514, 515, 516, 530. Medián je prostřední, tj. v našem případě osmá, z nich: ˜x = 507. Příklad 1.3. Máme záznamy o týdenních počtech dopravních nehod na určitém úseku dálnice během 20 týdnů: 6, 7, 6, 6, 5, 14, 6, 6, 7, 3, 7, 4, 6, 5, 3, 3, 8, 10, 6, 7. Znázorněte četnosti a kumulativní četnosti pomocí histogramu a najděte modus. Řešení. Tabulka četností je Týdenní počet nehod xi 3 4 5 6 7 8 10 14 Četnost ni 3 1 2 7 4 1 1 1 Kumulativní četnost 3 4 6 13 17 18 19 20 Příslušné histogramy vidíme na obrázcích 1.1 a 1.2. Ještě zbývá určit modus. Nejčastěji došlo k 6 nehodám, a proto ˆx = 6. Příklad 1.4. V anketě byli studenti tázáni, kolik hodin týdně stráví přípravou na jistý předmět. Ankety se účastnilo 70 studentů, v následující tabulce jsou četnosti jejich odpo- vědí: Počet hodin 1 2 3 4 5 ni 21 29 17 2 1 Určete aritmetický průměr, modus a medián počtu hodin strávených přípravou. 1.1 Základní pojmy a řešené příklady 9 3 4 5 6 7 8 9 10 11 12 13 14 1 2 3 4 5 6 7 ˇcetnost nehody Obr. 1.1: Histogram četností z příkladu 1.3 3 4 5 6 7 8 9 10 11 12 13 14 5 10 15 20 kumul. ˇcetnost nehody Obr. 1.2: Histogram kumulativních čet- ností Řešení. Vidíme, že jednu hodinu tráví přípravou 21 studentů, dvě hodiny 29 studentů, atd., celkem je studentů 70. Průměrný počet hodin je tedy podle (1.1) x = 1 70 (1 · 21 + 2 · 29 + 3 · 17 + 4 · 2 + 5 · 1) = 143 70 . = 2,04. Modus je ˆx = 2, protože nejvíce studentů tráví přípravou 2 hodiny týdně. Medián bude průměr 35. a 36. hodnoty v souboru seřazeném podle velikosti. V našem případě jsou obě hodnoty rovny dvěma (prvních 21 odpovědí je 1, následujících 29 je 2). Tedy ˜x = 1 2 (2 + 2) = 2. Příklad 1.5. Na 50 místech v určité oblasti byla měřena koncentrace polétavého prachu v ovzduší (v µg/m3 ). Byly zjištěny následující hodnoty (jsou již seřazené podle velikosti): 6 10 18 18 19 21 21 22 24 25 25 28 28 29 29 30 31 32 32 32 33 33 34 34 34 34 38 42 42 47 48 49 50 52 53 53 53 54 54 56 56 58 59 59 60 63 66 67 78 96 Najděte intervalové rozdělení četností a znázorněte je pomocí histogramu. Pomocí intervalových četností odhadněte aritmetický průměr. Dále najděte modální (nejčetnější) interval. Řešení. Máme n = 50 hodnot, tedy počet intervalů by měl být kolem 7 ( √ 50 . = 7, 1 + 3,3 log 50 . = 6,6). Hodnoty jsou zhruba v rozpětí od 0 do 100, můžeme proto volit intervaly délky 15. Poznamenejme, že počet a délka intervalů nejsou určeny nijak exaktně, mohli jsme si je zvolit i jinak. Nicméně není dobré volit intervalů příliš málo ani příliš mnoho. Rozdělení intervalových četností v našem případě je Interval 0, 15) 15, 30) 30, 45) 45, 60) 60, 75) 75, 90) 90, 105) Četnost 2 13 14 15 4 1 1 10 Základy popisné statistiky Histogram intervalových četností je znázorněn na obrázku 1.3. Vidíme, že modální interval je 45, 60), v něm se nalézá nejvíce hodnot. Pro odhad průměru můžeme použít středy intervalů: x . = 1 50 (7,5 · 2 + 22,5 · 13 + 37,5 · 14 + 52,5 · 15 + 67,5 · 4 + 82,5 + 97,5) = 41,4. Zdůrazněme, že se jedná pouze o odhad. Skutečná hodnota průměru, vypočítaná z přesných 50 hodnot, by vyšla 40,7. 15 30 45 50 75 90 105 5 10 15 ˇcetnost prach Obr. 1.3: Histogram intervalových četností z příkladu 1.5 1.2 Příklady pro samostatnou práci Příklad 1.6. Máme soubor hodnot 5, 1, 2, 1, 7, 5, 2, 5, 1, 1. Vypočtěte aritmetický průměr, výběrový rozptyl a směrodatnou odchylku. Dále najděte modus a medián. Výsledek: x = 3; s2 . = 5,11; s . = 2,26; modus ˆx = 1; medián ˜x = 2 Příklad 1.7. Máme soubor hodnot 6, 3, 9, 4, 3, 6, 7, 15, 0, 7, 3, 15, 3, 2, 5, 1, 2, 8, 3, 6, 4, 3, 1, 4, 0. Určete četnosti jednotlivých variant a pak pomocí těchto četností vypočítejte průměr, výběrový rozptyl a směrodatnou odchylku. Dále najděte modus a medián. Výsledek: Tabulka četností viz níže; x = 4,8; s2 . = 15,08; s . = 3,88; modus ˆx = 3; medián ˜x = 4 xi 0 1 2 3 4 5 6 7 8 9 15 ni 2 2 2 6 3 1 3 2 1 1 2 1.2 Příklady pro samostatnou práci 11 Příklad 1.8. Četnosti zkoumaného statistického znaku jsou v následující tabulce. xi 4 5 6 7 8 ni 4 3 3 7 3 a) Určete relativní četnosti a absolutní i relativní kumulativní četnosti. b) Vypočítejte průměr. c) Najděte medián a horní a dolní kvartil. Výsledek: a) viz níže; b) x = 6,1; c) medián ˜x = 6,5; dolní kvartil ˜x0,25 = 5; horní kvartil ˜x0,75 = 7 xi 4 5 6 7 8 rel. četn. fi 0,2 0,15 0,15 0,35 0,15 kumul. četn. 4 7 10 17 20 rel. kumul. četn. 0,2 0,35 0,5 0,85 1 Příklad 1.9. Známe rozdělení kumulativních četností zkoumaného znaku: xi 0 1 2 3 4 5 6 8 10 kumul. četnost 41 70 84 90 93 95 97 99 100 Části a) a b) se pokuste vyřešit, aniž byste hledali „obyčejné četnosti jednotlivých vari- ant. a) Najděte medián a horní kvartil. b) Kolikrát se ve statistickém souboru vyskytuje hodnota větší než 4? c) Určete rozdělení četností. Výsledek: a) medián ˜x = 1; horní kvartil ˜x0,75 = 2; b) sedmkrát; c) viz níže xi 0 1 2 3 4 5 6 8 10 ni 41 29 14 6 3 2 2 2 1 Příklad 1.10. Testu inteligence se účastnilo 60 lidí. Intervalové četnosti jejich výsledků jsou v následující tabulce: Interval 90, 100) 100, 110) 110, 120) 120, 130) 130, 140) ni 6 23 24 6 1 a) Kolika účastníkům testu bylo naměřeno IQ alespoň 110? b) Kolika účastníkům testu bylo naměřeno IQ menší než 110? c) Kolika účastníkům testu bylo naměřeno IQ nanejvýš 110? d) Odhadněte průměrnou naměřenou hodnotu IQ. Výsledek: a) 31; b) 29; c) z informací v tabulce nelze zjistit – nevíme, kolik lidí mělo IQ přesně 110; d) x . = 110,5 12 Základy kombinatoriky 2 Základy kombinatoriky Tato kapitola bude trochu odlišná od ostatních kapitol naší sbírky. Na rozdíl od nich totiž přímo nenavazuje na teorii probíranou v předmětu Matematika 3, ale měla by sloužit spíše jako opakování a příprava pro studium tohoto předmětu. Kombinatorika se zabývá problémem, kolik máme možností, jak z nějakého výchozího souboru objektů sestavit skupinu s určitými vlastnostmi, a pro některé partie pravděpodobnosti je zcela nepostradatelná. Ve skriptech z Matematiky 3 se počítá s tím, že základy kombinatoriky jsou již studentům známy ze střední školy. Protože však zkušenost ukazuje, že mnohé věci jsou ve druhém ročníku vysoké školy už dávno zapomenuty, považujeme za vhodné některé základní pojmy připomenout. Budeme se vždy snažit na konkrétních příkladech vysvětlit, jak se ke vzorcům pro počty variací, permutací či kombinací vlastně dojde. Komu se výklad, určený hlavně těm studentům, pro které je toto odvětví matematiky obtížné, bude zdát příliš „polopatistický , může jej samozřejmě přeskočit a věnovat se řešení příkladů samostatně. 2.1 Základní pojmy a řešené příklady Příklad 2.1. Na vrchol kopce vedou čtyři cesty. Kolika způsoby si může turista, který chce na tento kopec vystoupit, naplánovat výlet, jestliže si pro výstup i sestup může vybrat kteroukoli z cest? Řešení. Představme si, že po oněch čtyřech cestách vedou turistické značky: červená, modrá, zelená a žlutá. Turista může jít nahoru po kterékoli z nich. Má tedy čtyři možnosti, jak na kopec vystoupit. Dejme tomu, že si vybral červenou značku. Dolů pak může jít opět čtyřmi různými cestami. Máme tedy čtyři plány výletu, kdy se na kopec vystoupí po červené značce. Podobně pak čtyři plány začínající modrou, čtyři zelenou a čtyři žlutou značkou. Můžeme si je i vypsat (první písmeno označuje značku, po které šel turista nahoru, druhé značku pro sestup): ČČ MČ ZČ ŽČ ČM MM ZM ŽM ČZ MZ ZZ ŽZ ČŽ MŽ ZŽ ŽŽ Počet možností pro naplánování výletu je tedy 4 · 4 = 16. 2.1 Základní pojmy a řešené příklady 13 Příklad 2.2. Řešme nyní stejnou úlohu, ale tentokrát turista nechce jít zpět stejnou cestou, kterou na kopec vyšel. Kolik má možností v tomto případě? Řešení. Pro výstup si opět může vybrat kteroukoli ze čtyř značek. Jestliže si vybral červenou, má pro sestup už jen tři možnosti: modrou, zelenou nebo žlutou značku. Podobně je to pro případy, kdy si pro výstup zvolil některou jinou značku – pro každý z těchto případů má 3 možnosti cesty dolů. Možnosti si opět můžeme vypsat: ČM MČ ZČ ŽČ ČZ MZ ZM ŽM ČŽ MŽ ZŽ ŽZ Celkem existuje 4 · 3 = 12 variant výletu. Jestliže postup předvedený v předchozích dvou příkladech zobecníme, dostaneme tzv. pravidlo součinu, které budeme později často používat i při řešení složitějších příkladů: Pravidlo součinu Jestliže objekt A můžeme vybrat m způsoby a po každém takovém výběru lze objekt B vybrat n způsoby, pak výběr uspořádané dvojice (A,B) lze uskutečnit m·n způsoby. Poznamenejme, že čísla m a n nemusí být tak snadno určitelná jako u příkladů 2.1 a 2.2. Později uvidíme, že někdy budeme potřebovat složitější úvahu, abychom k nim dospěli. Nyní zkusíme pracovat s většími skupinami než s dvojicemi. Příklad 2.3. U jistého typu automobilu si zákazník může zvolit vůz jedné z pěti barev. Automobil může a nemusí být vybaven airbagy, stejně tak může a nemusí mít klimatizaci. Kolika způsoby si může zákazník vybrat? Řešení. Pro začátek z našich úvah vypustíme klimatizaci. Pokud budeme volit jen barvu a případné vybavení airbagy, máme celkem 5 · 2 = 10 možností. (Barvu můžeme zvolit 5 způsoby. Ke každé zvolené barvě máme ještě dvě možnosti, jak se rozhodnout: airbagy tam buď budou, nebo nebudou.) K libovolné z těchto 10 variant teď máme ještě dvě možnosti ohledně klimatizace. Celkem tedy existuje 5 · 2 · 2 = 20 možností pro výběr vybavení automobilu. Příklad 2.4. V prvním semestru prvního ročníku studenti skládají čtyři zkoušky (BMA1, BMTD, BFY1 a BEL11 ). U každé zkoušky může být student hodnocen stupněm A až F. Kolika různých celkových výsledků („vysvědčení ) může dosáhnout? Řešení. Pro zkoušku z BMA1 má 6 možností výsledku. Ke každému z nich pak pro zkoušku z BMTD zase 6. Tím máme 6·6 možností pro první dvě zkoušky. Ke každé z nich je 6 možností pro zkoušku z BFY1. To dělá 6 · 6 · 6 možností a ke každé z nich pak ještě je 6 možností pro výsledek zkoušky z BEL1. Výsledných možností pro celé studentovo „vysvědčení je tedy 6 · 6 · 6 · 6 = 64 = 1296. 1 Podle studijního plánu pro školní rok 2007/2008. 14 Základy kombinatoriky V tomto příkladu jsme sestavovali uspořádané čtveřice, udávající postupně známky z matematiky, materiálů, fyziky a elektrotechniky, ze šestiprvkové množiny možných výsledků {A, B, C, D, E, F}. Jednalo se o tzv. variace s opakováním. Variace s opakováním Variace s opakováním jsou uspořádané k-tice vybírané z n prvkové množiny, přičemž jednotlivé prvky se v k-ticích mohou opakovat. Protože každý z k prvků můžeme vybrat n způsoby, počet těchto variací je n · · · n k kr´at = nk . S variacemi s opakováním jsme se setkali už v příkladu 2.1, kde jsme sestavovali uspořádané dvojice ze čtyřprvkové množiny {Č, M, Z, Ž}. Výsledek tohoto příkladu můžete porovnat s výše uvedeným vzorcem. Příklad 2.5. Nový děkan jisté fakulty si vybírá 3 proděkany: pro studium, pro vědu a výzkum a pro vnější vztahy. V úvahu připadá celkem 10 lidí, se kterými je zadobře. Kolik je možností pro nové vedení fakulty? Řešení. Jako studijního proděkana si může vybrat kohokoli z 10. K němu pak jako vědeckého proděkana už jen někoho ze zbývajících 9 lidí. Tím máme 10 · 9 možností pro první dva proděkany a ke každé z nich je pak ještě 8 možností pro volbu třetího. Celkem je 10 · 9 · 8 = 720 možností. Tentokrát jsme z množiny deseti lidí sestavovali uspořádané trojice proděkanů, ve kterých se prvky nemohly opakovat. Jak již asi tušíte, byly to tzv. variace bez opakování. Variace bez opakování Variace bez opakování jsou uspořádané k-tice vybírané z n prvkové množiny, přičemž jednotlivé prvky se v k-ticích nesmí opakovat. Protože první prvek můžeme vybrat n způsoby, druhý n−1 způsoby atd., počet těchto variací je n · (n − 1) · · · (n − k + 1) celkem n´asob´ιme k ˇc´ιsel Všímavý čtenář jistě rozeznal, že na variace bez opakování byl již příklad 2.2. Příklad 2.6. Pět přátel si koupilo lístky do kina. Kolika způsoby se mohou na vyhrazených pěti sedadlech rozesadit? Řešení. Můžeme v podstatě zopakovat úvahu z příkladu s proděkany. Na první sedadlo si může sednout kterýkoli z pěti kamarádů, na druhé pak už jen někdo ze zbylých čtyř, na třetí pak ze tří, atd. Celkem se mohou usadit 5 · 4 · 3 · 2 · 1 = 120 způsoby. 2.1 Základní pojmy a řešené příklady 15 Nyní jsme zkoumali, kolika způsoby se dá – co do pořadí – přeskupit 5 objektů (v našem případě návštěvníků kina). Též by se dalo říct, že jsme sestavovali uspořádané pětice z pěti prvků. Tím se dostáváme k tzv. permutacím. Dříve, než je budeme definovat, připomeňme pro jistotu pojem, který s permutacemi úzce souvisí. Faktoriál Je-li n přirozené číslo, pak symbolem n! (čteno „n faktoriál ) rozumíme součin všech přirozených čísel od 1 do n: n! = n · (n − 1) · · · 1 Speciálně se definuje 0! = 1. Výsledek předchozího příkladu se tedy mohl zapsat jako 5!. Permutace Permutace jsou uspořádané n-tice vybírané z n prvkové množiny, přičemž jednotlivé prvky se nesmí opakovat. Počet permutací z n prvků (neboli počet všech možných přeskupení n prvků) je n · (n − 1) · · · 1 = n! Nyní zkusíme o něco obtížnější variantu příkladu s návštěvníky kina. Příklad 2.7. Sedm přátel, čtyři chlapci a tři dívky, si koupilo lístky do kina. Chtějí se rozesadit tak, aby chlapci a dívky seděli střídavě. Kolik mají možností, jak to udělat? Řešení. Na počet možných rozesazení se dá přijít více způsoby. Můžeme si například říct, že první sedadlo musí obsadit některý ze čtyř chlapců. Ke každé z těchto čtyř možností máme 3 možnosti, jak obsadit druhé sedadlo některou z dívek. Ke každé z výsledných 4·3 možností pro první dvě sedadla máme 3 možnosti, jak obsadit třetí sedadlo některým ze zbývajících chlapců, atd. Tímto způsobem dostáváme výsledek ve tvaru 4·3·3·2·2·1·1 = = 144. K témuž výsledku se ale můžeme dostat i tak, že si řekneme, že určitá 4 sedadla jsou vyhrazena chlapcům. Ti je mohou obsadit 4! = 24 způsoby. Ke každému z těchto 24 způsobů rozesazení chlapců máme 3! rozesazení dívek na 3 sedadla, která jsou jim vyhrazena. To dává celkem 4! · 3! = 24 · 6 = 144 možností. Druhý z postupů předvedených v tomto příkladu použijeme nyní. Příklad 2.8. Kolik různých slov se dá sestavit ze všech písmen slova ANANAS? (Slovem zde rozumíme libovolné přeskupení zadaných písmen; význam takovéto „slovo mít nemusí.) 16 Základy kombinatoriky Řešení. Máme k dispozici 6 písmen, z nichž některá se opakují. Kdyby všechna písmena byla navzájem různá, odpověď na otázku by byla jednoduchá. Proto budeme pro začátek považovat jednotlivá A a N za různá písmena – slovo by pak mohlo vypadat např. ANanaS. Máme 6! možností, jak tyto znaky přeskupit. Ovšem některá z těchto přeskupení jsou ve skutečnosti totožná. Např. ASnaNa je totéž slovo jako aSNanA. Všech 6! přeskupení proto můžeme rozdělit do několika (zatím nevíme kolika – tento počet je právě úkolem zjistit) skupin, které se skládají vždy ze stejných slov. Kdybychom to např. brali podle abecedy, v první skupině by byla slova AaaNnS, aAanNS, . . . , ve druhé AaaNSn, aAanSN, . . . , atd. Zkoumejme nyní, kolik prvků má první skupina (AAANNS). Je to podobný úkol jako v příkladu 2.7. Pro rozmístění tří různých písmen A na prvních třech místech slova máme 3! možností. Ke každé z těchto možností jsou pak 2 (nebo, chceme-li, 2!) možnosti, jak uspořádat dvě různá písmena N na dalších dvou místech. Poslední S je pak umístěno pevně. Celkem tedy je 3! · 2! slov (se zatím rozlišitelnými A a N), která dávají slovo AAANNS. Stejným způsobem bychom dospěli k tomu, že v každé z ostatních skupin je také 3! · 2! slov. Když situaci zrekapitulujeme, vidíme, že máme celkem 6! slov rozdělených do skupin. V každé skupině je 3! · 2! slov. Počet skupin neboli počet různých slov sestavitelných z písmen ANANAS je tedy 6! 3! · 2! = 6 · 5 · 4 · 3 · 2 · 1 3 · 2 · 1 · 2 · 1 = 60. Obecně, zkoumáme-li přeskupení n předmětů, z nich některé se opakují, mluvíme o permutacích s opakováním. Ke vzorci pro jejich celkový počet bychom dospěli stejnou úvahou jako v předchozím příkladu. Permutace s opakováním Permutace s opakováním jsou permutace sestavované z n prvkové množiny, ve které je n1 prvků prvního druhu, n2 prvků druhého druhu, . . . , nk prvků k-tého druhu, kde n1 + n2 + · · · + nk = n. Jejich počet je n! n1! · n2! · · · nk! . Příklad 2.9. Máme balíček 32 různých karet. Hráč dostane 5 karet. Kolik je možností pro tuto pětici? (Nezáleží na tom, v jakém pořadí byly karty rozdány. Záleží pouze na tom, které karty hráč dostal.) Řešení. Kdyby na pořadí karet záleželo, byli bychom ve stejné situaci jako v příkladu 2.5. Šlo by o variace bez opakování. První karta by mohla být kterákoli z 32, k ní druhá pak kterákoli z 31, atd. Celkem bychom měli 32 · 31 · 30 · 29 · 28 = 24 165 120 možností. Jenže zde na pořadí karet nezáleží. Uspořádaná pětice K♥, Q♣, 10♥, 8♦, 7♠ hráči vyjde nastejno jako 8♦, Q♣, 7♠, K♥, 10♥. Všech 24 165 120 možností proto můžeme rozdělit do (opět zatím neznámého počtu) skupin. Každá skupina se skládá z pětic karet, které se 2.1 Základní pojmy a řešené příklady 17 liší pouze pořadím. Pět karet můžeme přeskupit 5! způsoby, každá skupina má proto 5! prvků. Počet skupin neboli počet všech různých pětic karet sestavitelných z 32 karet je proto 32 · 31 · 30 · 29 · 28 5! . S tímto výsledkem můžeme ještě chvíli „čarovat . Zlomek rozšíříme výrazem 27!. Po úpravě pak dostaneme výsledek v kompaktnějším tvaru: 32 · 31 · 30 · 29 · 28 5! = 32 · 31 · 30 · 29 · 28 · 27! 5! · 27! = 32! 5! · 27! Jiný způsob řešení: Představme si, že máme karty nějak uspořádané, např. A♥, A♦, A♠, A♣, K♥, K♦, . . . , 7♥, 7♦, 7♠, 7♣. Každá pětice karet se teď dá interpretovat jako 32-členná posloupnost pěti jedniček a dvaceti sedmi nul. Jedničky jsou na místech vybraných karet, nuly na všech ostatních. Např. posloupnost (1, 0, 1, 0, 0, 1, 0, . . . , 0, 1, 1) by znamenala, že hráč dostal A♥, A♠, K♦, 7♠ a 7♣. Zadanou otázku teď můžeme převést na problém, kolika způsoby lze navzájem přeskupit pět jedniček a 27 nul. Na tuto otázku už ale odpověď známe. Jde o něco podobného jako v příkladu s ananasem a výsledek je 32! 5! · 27! . Oběma způsoby jsme dospěli k témuž výsledku, který po vyčíslení dá 201 376 možných pětic sestavitelných z 32 karet. Tento příklad byl velmi důležitý. Otázka, kolika způsoby lze vybrat z n-prvkové množiny k-prvkovou skupinu, ve které nezáleží na pořadí, ale pouze na tom, které prvky byly vybrány, se vyskytuje velmi často. V právě předvedeném příkladu jsme odvodili vztah pro výpočet počtu pětiprvkových podmnožin z dvaatřicetiprvkové množiny. V následujícím rámečku je situace popsána obecně. Kombinace, kombinační čísla Kombinace k-té třídy z n prvků jsou k-prvkové skupiny vybírané z n-prvkové množiny, přičemž nezáleží na pořadí, v jakém prvky byly vybrány. Jinými slovy, jsou to k-prvkové podmnožiny z množiny mající n prvků. Počet takovýchto kombinací je n k = n! k! · (n − k)! . Symbol n k čteme „n nad k a nazýváme jej kombinační číslo. U karet ještě chvíli zůstaneme a zkusíme o něco složitější příklady. Výpočty kombinačních čísel pro jistotu v prvních několika případech rozepíšeme. Příklad 2.10. Kolika způsoby můžeme z balíčku 52 karet (4 × 13 karet v barvách ♥, ♦, ♠, ♣ o hodnotách 2, 3, . . . , K, A) vybrat pětici karet, v které jsou právě dvě esa? 18 Základy kombinatoriky Řešení. Nejprve se podíváme, kolika způsoby lze z balíčku vybrat dvojici es. Esa máme celkem 4, z nich vybíráme dvojici, nezáleží nám na tom, v jakém pořadí jsme karty vybrali, ale jen na tom, z kterých es se dvojice skládá. Počet všech možných dvojic je proto 4 2 = 4! 2! · 2! = 4 · 3 · 2 · 1 2 · 1 · 2 · 1 = 6. Jestliže už je nějaká dvojice es vybrána, musíme k ní – pro doplnění do pětice – vybrat ještě tři karty jiné než esa. Takovýchto karet máme 48, vybíráme z nich trojici. Pro tento výběr je počet možností 48 3 = 48! 3! · 45! = 48 · 47 · 46 · 45! 3 · 2 · 1 · 45! = 17 296. Nyní použijeme pravidlo součinu – dvojici es lze vybrat 4 2 způsoby, ke každé takovéto dvojici lze zbývající trojici doplnit 48 3 způsoby, pětici složenou ze dvou es a tří „ne-es můžeme proto sestavit 4 2 · 48 3 = 6 · 17 296 = 103 776 způsoby. Kombinační čísla se dají snadno vypočítat pomocí tzv. Pascalova trojúhelníka. Tímto názvem označujeme tabulku trojúhelníkového tvaru n = 0 1 n = 1 1 1 n = 2 1 2 1 n = 3 1 3 3 1 n = 4 1 4 6 4 1 n = 5 1 5 10 10 5 1 n = 6 1 6 15 20 15 6 1 Každý řádek zde obsahuje všechna kombinační čísla pro totéž n. Podle známého vzorce, n k + n k+1 = n+1 k+1 , dostaneme sečtením dvou sousedních kombinačních čísel některého řádku to kombinační číslo, jež stojí v dalším řádku pod mezerou mezi nimi. Pascalův trojúhelník tak může sloužit k dosti rychlému výpočtu kombinačních čísel. Příklad 2.11. Kolika způsoby můžeme z balíčku 52 karet vybrat 6 karet tak, aby nanejvýš jedna z vybraných karet byla piková? Řešení. Má-li být ve vybrané šestici nanejvýš jedna piková karta, znamená to, že šestice obsahuje buď právě jednu takovou kartu, nebo žádnou. Celkový počet proto dostaneme tak, že sečteme počet šestic skládajících se z jedné pikové karty (takovýchto karet máme celkem k dispozici 13) a pěti jiných karet (jiných karet je celkem 39) a počet šestic složených ze samých karet jiných než pikových. Jednotlivé počty určíme podobně jako v předchozím příkladu, celkový výsledek je pak 13 · 39 5 + 39 6 . 2.1 Základní pojmy a řešené příklady 19 Postup použitý v tomto příkladu můžeme zobecnit. Často se podaří objekty, jejichž počet chceme zjistit, rozdělit do více skupin, jejichž počty prvků umíme určit. Celkový počet objektů je pak roven součtu počtů prvků jednotlivých skupin. Musíme však dát pozor na to, aby jednotlivé skupiny byly disjunktní, tj. aby žádný objekt nespadal do více skupin současně. Jako varování by nám mohl posloužit následující příklad. Příklad 2.12. Jistá vysoká škola promíjí přijímací zkoušku uchazečům, kteří maturovali z matematiky nebo z fyziky a dosáhli alespoň z jednoho z těchto předmětů klasifikace výborně. Z celkového počtu 1000 přihlášených na tuto školu maturovalo z matematiky na výbornou 100 uchazečů a z fyziky 80. Kolik uchazečů bude přijato bez přijímací zkoušky? Pokus o řešení: Někdo by si třeba mohl říct, že výsledek je 100 + 80 = 180. Tento výsledek však vůbec nemusí být správný. Uchazeči, kteří maturovali za jedna z matematiky i z fyziky, jsou zde započítáni dvakrát. Na základě informací, které máme, nejsme schopni počet lidí přijatých bez přijímaček přesně určit. Kdybychom ale navíc věděli, že 30 uchazečů maturovalo na výbornou z obou předmětů, úloha by již řešitelná byla. Počet přijatých bez přijímací zkoušky by byl 100 + 80 − 30 = 150. Vzali jsme 100 lidí, kteří mají jedničku z matematiky, a k nim jsme přidali z těch, kdo mají jedničku z fyziky, jen ty, kteří ještě nebyli započítáni v „matematicích . Obecně je řešení našeho příkladu 100 + 80 − m, kde m je počet uchazečů s jedničkou z obou předmětů. Příklad 2.13. Kolik lze sestavit pěticiferných čísel z číslic 1, 2, 3, takových že na začátku nebo na konci je jednička? Řešení. Čísel, která začínají jedničkou, je 34 (na prvním místě je napevno jednička, na druhém až pátém místě může být kterákoli ze tří možností). Podobně máme 34 čísel, která jedničkou končí. Abychom získali počet čísel, která mají na začátku nebo na konci jedničku, nestačí vzít 2 · 34 , protože čísla jedničkou začínající i končící by byla započítána dvakrát. Takovýchto čísel je 33 (na prvním a pátém místě jedničky, na zbylých třech místech cokoli ze tří možností). Výsledek je tedy 34 + 34 − 33 = 81 + 81 − 27 = 135. Jiný způsob řešení Příklad můžeme řešit též tak, že zjistíme, kolik čísel nevyhovuje požadované podmínce, a tento počet pak odečteme od celkového počtu možností. Celkem můžeme z číslic 1, 2, 3 sestavit 35 pěticiferných čísel. Počet čísel, která jedničku na začátku ani na konci nemají, je 2 · 3 · 3 · 3 · 2, protože první a pátou cifru můžeme vybrat pouze ze dvou možností, zatímco všechny ostatní ze tří. Výsledek je pak 35 − 2 · 33 · 2 = 243 − 108 = 135 20 Základy kombinatoriky Druhý předvedený způsob řešení – určení počtu možností, které zadané podmínce nevyhovují, a jeho odečtení od počtu všech možností – je v některých případech výhodnější než přímé hledání počtu vyhovujících možností. Často se používá v příkladech typu „kolik existuje skupin obsahujících aspoň jeden prvek s danou vlastností . Na závěr si uvedeme příklad, který jsme díky vhodnému přeformulování schopni vyřešit mnohem snadněji. Příklad 2.14. Kolik lze sestavit trojciferných čísel, takových že číslice na místě jednotek je menší než číslice na místě stovek, a ta je menší než číslice na místě desítek ? Řešení. Stačí si uvědomit, že když máme k dispozici tři různé číslice (od 0 po 9), tak hledané trojciferné číslo je už jednoznačně dané – nejmenší číslice bude na místě jednotek, prostřední na místě stovek a největší na místě desítek. Proto úlohu můžeme přeformulovat následovně: Kolik je trojprvkových podmnožin množiny {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}? Hledaný počet je 10 3 = 120. 2.2 Příklady pro samostatnou práci Příklad 2.15. V zábavném testu v novinách je úkolem přiřadit k literárním dílům jejich autory. Celkem je zadáno 10 děl a 10 autorů. Kolika způsoby může být tento test vyplněn, jestliže ke každému dílu nějakého autora přiřadíme? Výsledek: 10! Příklad 2.16. U přijímací zkoušky z matematiky je 20 otázek a u každé z nich je 5 možností odpovědi. Kolika způsoby může uchazeč test vyplnit, jestliže a) u každé otázky zaškrtne právě jednu odpověď? b) u každé otázky buď zaškrtne jednu odpověď, nebo otázku nechá nezodpovězenou? Výsledek: a) 520 , b) 620 Příklad 2.17. Kolika způsoby je možné rozměnit 100 Kč, jestliže jsou k dispozici 50, 20, 10 a 5 - koruny? Bankovek a mincí je neomezený počet. Výsledek: 491 Příklad 2.18. Finále sportovní soutěže se účastní 12 závodníků. Nikdo není diskvalifikován, na žádném místě nemohou skončit dva nebo více závodníků současně. a) Kolik je možných výsledků soutěže? b) Kolik je možných výsledků takových, že loňský vítěz neobhájí své umístění? (Předpokládáme, že loňský vítěz se účastní.) c) Kolik je možných výsledků takových, že první tři místa budou obsazena stejnými závodníky jako minule, i když třeba v jiném pořadí? Výsledek: a) 12!, b) 12! − 11! = 11 · 11!, c) 3! · 9! 1 Tento výsledek nebyl získán pomocí variací, kombinací apod. Příklad je tu spíše na ukázku, že ne vše se dá řešit takto jednoduše. V výsledku se dá dopracovat například systematickým rozepsáním možností. Existuje i důmyslnější cesta, ta ale přesahuje rámec našeho kurzu. 2.2 Příklady pro samostatnou práci 21 Příklad 2.19. U stánku prodávají trička v šesti velikostech, čtyřech různých barvách a buď s jedním ze čtyř různých obrázků, nebo bez obrázku. Kolik různých typů triček mohou maximálně mít? Výsledek: 6 · 4 · 5 = 120 Příklad 2.20. Kolik existuje čtyřpísmenných slov skládajících se z 26 písmen abecedy (bez háčků a čárek), která obsahují písmeno x? Výsledek: 264 − 254 Příklad 2.21. V mateřské školce je 10 dětí. Když jdou na procházku, mají vytvořit 5 dvojic. Kolika způsoby to můžou udělat? Zajímá nás jen to, kdo je s kým ve dvojici, pořadí dvojic ne. Výsledek: 945 Příklad 2.22. Do tanečních chodí 20 chlapců a 30 dívek. a) Kolika způsoby z nich lze vytvořit jeden taneční pár? b) Kolika způsoby mohou naráz vytvořit 20 tanečních párů? Výsledek: a) 20 · 30, b) 30 · 29 · · · 12 · 11 Příklad 2.23. Otylka se rozhodla, že bude dvakrát týdně chodit na aerobic. a) Kolika způsoby si může vybrat dvojici dnů (mimo víkend)? b) Kolika způsoby si může vybrat dvojici dnů (opět mimo víkend), jestliže nechce chodit dva dny po sobě? Výsledek: a) 5 2 = 10, b) 5 2 − 4 = 6 Příklad 2.24. Osm přátel, čtyři chlapci a čtyři dívky, si koupilo lístky do kina. Kolika způsoby se mohou rozesadit, jestliže a) chlapci a dívky chtějí sedět střídavě? b) všechny dívky chtějí sedět pospolu? (Chlapci v jednom bloku sedět nemusí.) c) Adam a Eva chtějí sedět vedle sebe? Výsledek: a) 2 · 4! · 4!, b) 5 · 4! · 4!, c) 7 · 2 · 6! Příklad 2.25. Kolika způsoby můžeme ze třídy, v níž je 15 chlapců a 17 dívek, vybrat sedmičlennou skupinu tak, aby v ní byli a) tři chlapci a čtyři dívky, b) aspoň jeden chlapec, c) aspoň jeden chlapec a aspoň jedna dívka, d) aspoň šest chlapců? Výsledek: a) 15 3 · 17 4 , b) 32 7 − 17 7 , c) 32 7 − 17 7 − 15 7 , d) 15 6 · 17 + 15 7 Příklad 2.26. Kolika způsoby se může 30 studentů rozdělit ke třem učitelům, jestliže a) každý učitel jich může přijmout právě 10? b) každý učitel může přijmout neomezené množství? Výsledek: a) 30 10 · 20 10 · 10 10 = 30!/(10! · 10! · 10!), b) 330 22 Základy kombinatoriky Příklad 2.27. Pět závodníků, Adam, Bořek, Cyril, Dušan a Emil, běželo 100m. Kolik je takových pořadí, kdy Adam doběhl dříve než Bořek? Výsledek: 60 23 3 Klasická a podmíněná pravděpo- dobnost 3.1 Základní pojmy a řešené příklady Před uvedením formální definice pravděpodobnostního prostoru začneme několika příklady pro osvětlení problematiky. V každém z nich se jedná o dobře známý náhodný proces s jedním z několika (předem známých) možných výsledků. Naše chápání náhodných jevů • Hod mincí – má 2 možné výsledky hlava / orel, neboli 1/0. Každý padá se zhruba stejnou četností (říkáme „s pravděpodobností 1 2 ). • Hod kostkou – má 6 možných výsledků 1, 2, 3, 4, 5, 6. Opět každý padá se stejnou četností (říkáme „s pravděpodobností 1 6 ). • Zamíchání karet – předpokládáme, že každé možné zamíchání karet lze asi stejně dobře očekávat. Zde je však všech možností nesrovnatelně více – 32! ˙=2,6 · 1035 , což vůbec nejsme schopni ani vypsat. Tento přirozený příklad zároveň přináší zajímavou filozofickou otázku: Jak můžeme tvrdit, že každé možné pořadí karet nastane stejně pravděpodobně, když se patrně za celou dobu existence lidstva a karet skutečně objeví jen nepatrný zlomek všech zamíchání? Toto lze seriózně rozřešit pouze použitím přesného formálního matematického modelu pravděpodobnosti. • Tah sportky – očekáváme, že každé příští tažené číslo bude „stejně pravděpodobné ze všech čísel zbylých v osudí. Celý tah je však ve výsledku neuspořádaným výběrem, takže počet všech možností je 49 6 = 13 983 816. I to je příliš vysoké číslo pro snadnou představu. A teď si pro takové příklady uvedeme příslušný matematický aparát: Označme Ω množinu všech možných výsledků pokusu, který provádíme. Náhodný jev A je jakákoli podmnožina množiny Ω, A ⊆ Ω. 24 Klasická a podmíněná pravděpodobnost Klasická pravděpodobnost Předpokládejme, že pokus má n možných výsledků (množina Ω má n prvků) a že všechny výsledky jsou stejně pravděpodobné. Dále předpokládejme, že z těchto n výsledků jich je m příznivých jevu A (neboli množina A má m prvků, |A| = m). Klasická pravděpodobnost jevu A se definuje jako podíl počtu příznivých výsledků ku počtu všech možných výsledků: P(A) = m n . Opačný jev (doplněk) k jevu A: A = Ω − A (obsahuje všechny možné výsledky, které neodpovídají jevu A). P(A) = 1 − P(A) Příklad 3.1. Jaká je pravděpodobnost toho, že při hodu klasickou šestistěnnou kostkou padne číslo 6? Řešení. Všech možností na jedné kostce je 6 a jen jedna z nich je, že padne číslo 6, tedy P(padne šestka) = 1 6 . Příklad 3.2. Číslice 1, 2, 3, 4 jsou napsané na čtyřech kartách. Náhodně vybereme dvě karty a naskládáme je vedle sebe v tom pořadí, v jakém jsme je vybrali. Vypočítejte pravděpodobnost toho, že takto vzniklé dvouciferné číslo bude liché. Řešení. Všech možností je 4 · 3, protože první kartu vybíráme ze čtyř karet a druhou už jenom ze tří. Liché číslo má na místě jednotek liché číslo, v našem případě to může být 1 nebo 3. Na místo desítek pak můžeme použít v obou případech 2, 4 nebo zbylé liché číslo (21,31,41,13,23,43), příznivých případů je proto 6. Tedy P(vybereme liché dvouciferné číslo) = 6 4·3 = 6 12 = 1 2 . Příklad 3.3. Jaká je pravděpodobnost toho, že při jednom hodu klasickou šestistěnnou kostkou padne číslo menší než 6? Řešení. Jestliže má padnout číslo menší než 6, musí padnout 1, 2, 3, 4 nebo 5. Takže všech možností je 6, příznivých je 5, pravděpodobnost je tedy P = 5 6 . Úlohu jsme mohli vyřešit i jako pravděpodobnost doplňkového jevu, který v našem případě je, že padne šestka. Tento jev má pravděpodobnost 1 6 , tedy pravděpodobnost našeho jevu je P = 1 − 1 6 = 5 6 . Příklad 3.4. Jaká je pravděpodobnost toho, že při hodu třemi klasickými šestistěnnými kostkami padne součet menší než 17? Řešení. Zatímco v předchozím příkladu jsme výhodu doplňkového jevu nezaznamenali, teď je rozhodně nejjednodušší doplňkový jev použít. Doplňkový jev zřejmě je, že součet bude alespoň 17. Víme, že maximální součet je 3 · 6 = 18. Proto si stačí všimnout jen dvou možných součtů, které jsou navíc velice jednoduché. Součet 18 padne, jen když na všech kostkách padne šestka (jediná možnost 6,6,6) a součet 17 padne, jen když na dvou 3.1 Základní pojmy a řešené příklady 25 kostkách padnou šestky a na jedné pětka (tři možnosti 5,6,6; 6,5,6; 6,6,5). Všech možností na třech kostkách je 6·6·6 = 216, počet příznivých možností je 1+3, tedy pravděpodobnost doplňkového jevu je P = 4 216 . Pravděpodobnost našeho jevu je P = 1−P = 1− 4 216 = 212 216 . Nesprávný pokus o řešení: Někdo by možná mohl příklad řešit tímto způsobem: Házíme-li třemi kostkami, může padnout součet 3 (padly tři jedničky), 4 (dvě jedničky a dvojka), . . . , 18 (tři šestky). Tj. máme 16 možností, jak může náš „pokus dopadnout. Z toho správných – menších než 17 – je 14. Pravděpodobnost toho, že padne součet menší než 17, je proto 14 16 . Rozmyslete si, proč je tento postup špatný. Příklad 3.5. Házíme třemi klasickými šestistěnnými kostkami. Zjistěte, jestli je pravděpodobnější, že padne součet 9, nebo součet 10. Nesprávný pokus o řešení: Jedna z možností (bohužel nesprávná) může vypadat takto: 10 = 6 + 3 + 1 = 6 + 2 + 2 = 5 + 4 + 1 = 5 + 3 + 2 = 4 + 4 + 2 = 4 + 3 + 3 a 9 = 6 + 2 + 1 = 5 + 3 + 1 = 5 + 2 + 2 = 4 + 4 + 1 = 4 + 3 + 2 = 3 + 3 + 3. Jelikož počty rozkladů jsou u obou čísel stejné, může někdo nabýt dojmu, že pravděpodobnosti uvedených součtů jsou stejné. Všímavý čtenář (obzvlášť jestliže se zamyslel nad předchozím příkladem) ví, že například součet 6 + 3 + 1 má větší šanci než například součet 4 + 4 + 2 nebo 3 + 3 + 3. Proč? Řešení. Zatímco možnost, že padnou tři trojky, je jediná, máme tři možnosti, že padnou dvě čtyřky a jedna dvojka, šest možností, že padne jedna šestka, jedna trojka a jedna jednička. Když teď spočítáme skutečné počty možností pro jednotlivé součty, zjistíme, že pro součet 10 jich je víc (zkuste si to sami ověřit). Proto pravděpodobnost, že padne součet 10, je vyšší než pravděpodobnost součtu 9. Příklad 3.6. Jaká je pravděpodobnost, že při hodu třemi klasickými šestistěnnými kostkami padne aspoň jedna šestka? Řešení. Všech možností na třech kostkách je 6 · 6 · 6 = 216. Jestliže má padnout aspoň jedna šestka, musíme spočítat pravděpodobnosti toho, že padne jedna, dvě nebo tři šestky, a protože to jsou jevy neslučitelné, výsledná pravděpodobnost bude součtem těchto tří pravděpodobností. Jednodušší však je spočítat pravděpodobnost doplňkového jevu, tedy pravděpodobnost toho, že nepadne ani jedna šestka. To znamená, že na každé kostce máme 5 možností (to, že padne šestka, nemůže nastat), a proto počet příznivých možností je 5 · 5 · 5 = 125. Pravděpodobnost doplňkového jevu je P(nepadne ani jedna šestka) = 125 216 , a P(padne aspoň jedna šestka) = 1 − 125 216 = 91 216 . = 0,421. 26 Klasická a podmíněná pravděpodobnost Příklad 3.7. Ve Sportce hráč tipuje 6 čísel ze 49. Potom je 6 čísel vylosováno. Sázející získává výhru v 1. pořadí, jestliže vyjde všech 6 čísel, která vsadil. Výhru ve 2. pořadí získá, jestliže uhodl 5 čísel, ve 3. pořadí, jestliže uhodl 4 čísla, a nejnižší je výhra ve 4. pořadí pro 3 uhodnutá čísla. Jaká je pravděpodobnost, že sázející a) získá výhru v 1. pořadí, b) získá výhru ve 4. pořadí, c) uhodne aspoň jedno číslo? Řešení. a) Všech možností, jak mohlo být vylosováno 6 čísel ze 49, je 49 6 . Příznivá je pouze jediná možnost – když byla vylosována přesně ta šestice, kterou hráč vsadil. Proto P = 1 49 6 = 1 13 983 816 . = 7 · 10−8 (s výhrou moc nepočítejte. . . ) b) Počet všech možností zůstává 49 6 . Nyní musíme zjistit, kolik je možností pro vylosované šestice, tak aby se skládaly ze tří vsazených čísel a tří čísel, která hráč nevsadil. Trojici uhodnutých čísel můžeme vybrat 6 3 způsoby. Ke každému z nich ještě musíme doplnit trojici „špatných čísel. Tato čísla vybíráme ze 43 čísel, která hráč nevsadil, a máme pro ně 43 3 možností. Proto můžeme šestici skládající se ze tří vsazených a tří nevsazených čísel sestavit 6 3 · 43 3 způsoby. Celkem pak P = 6 3 · 43 3 49 6 . = 0,018 (taky žádná sláva. . . ) c) Zde bude nejlepší vypočítat nejprve pravděpodobnost jevu opačného, tj. toho, že neuhodne vůbec žádné číslo. Celá šestice vylosovaných čísel tedy musí být sestavena pouze ze 43 čísel, která hráč nevsadil. Na to máme 43 6 možností. Pravděpodobnost, že tipující uhodne aspoň jedno číslo, je tedy P = 1 − P(neuhodne nic) = 1 − 43 6 49 6 . = 1 − 0,436 = 0,564. Nyní si objasníme další důležité pojmy: Průnik jevů A, B : A ∩ B (obsahuje všechny výsledky, které odpovídají oběma jevům A, B) Sjednocení jevů A a B : A ∪ B (obsahuje všechny výsledky, které odpovídají alespoň jednomu z jevů A, B). Pro pravděpodobnost sjednocení jevů obecně platí P(A ∪ B) = P(A) + P(B) − P(A ∩ B). Pro jevy, které nemohou nastat současně (neslučitelné jevy, jejich průnik je prázdný), platí P(A ∪ B) = P(A) + P(B). Oba vztahy plynou ze známé vlastnosti zjednocení a průniku množin |A ∪ B| = |A| + |B| − |A ∩ B|. 3.1 Základní pojmy a řešené příklady 27 Příklad 3.8. Jaká je pravděpodobnost toho, že při hodu klasickou šestistěnnou kostkou padne buď číslo 3, nebo 6? Řešení. Pravděpodobnost, že padne šestka, je 1 6 a pravděpodobnost toho, že padne trojka, je také 1 6 . Jelikož tyto dva jevy jsou neslučitelné, můžeme použít součtovou větu a dostaneme výslednou pravděpodobnost: P = 1 6 + 1 6 = 1 3 . Podmíněná pravděpodobnost Víme, že určitý jev A nastal, a zkoumáme pravděpodobnost jevu B za této podmínky. Podmíněná pravděpodobnost jevu B za podmínky, že nastal jev A, je P(B/A) = P(A ∩ B) P(A) . Podmíněnou pravděpodobnost ovšem nemusíme vždy počítat podle tohoto vzorce, někdy je lepší přímý výpočet. Často spíše naopak počítáme pravděpodobnost průniku jako P(A ∩ B) = P(A) · P(B/A). Zřejmě P(A ∩ B) = P(B ∩ A) = P(B) · P(A/B), a proto P(A) · P(B/A) = P(B) · P(A/B), což se někdy může hodit. Nezávislost jevů Intuitivně: Jevy A, B jsou nezávislé, jestliže to, že nastal jev A, nijak neovlivní pravděpodobnost toho, že nastane jev B, a naopak neboli jestliže P(B/A) = P(B) a P(A/B) = P(A). Začneme několika jednoduchými ukázkami. • Nezávislé jevy: dva hody toutéž kostkou za sebou, hod kostkou a současné zamíchání karet, dva různé tahy sportky. 28 Klasická a podmíněná pravděpodobnost • Závislé jevy: vrchní a spodní číslo padlé při jednom hodu kostky, výběr první a druhé karty ze zamíchaného balíčku, dvě akumulační kurzové sázky obsahující stejné utkání. Obecně definujeme, že jevy A, B jsou nezávislé, jestliže P(A ∩ B) = P(A) · P(B). Příklad 3.9. Hodíme dvěma stejnými kostkami najednou. Jaká je pravděpodobnost, že nám padne 4 a 5? Řešení. Hody obou kostek jsou nezávislé, neboť v poctivé situaci mezi nimi není fyzická vazba. Pravděpodobnost, že na první kostce padne 4, je 1 6 , a obdobně je 1 6 pravděpodobnost toho, že na druhé padne 5. Obě možnosti najednou padnou s pravděpodobností po vynásobení 1 6 · 1 6 = 1 36 . Musíme si však dát pozor na to, že kostky jsou stejné a my nemáme určeno, na které padne 4. Proto se úloha vlastně rozpadá na dva disjunktní jevy: „na první padne 4 a na druhé 5 a „na první 5 a na druhé 4 , a proto výsledná pravděpodobnost je součtem pravděpodobností obou možností P = 1 36 + 1 36 = 1 18 . Příklad 3.10. Vytáhneme-li z karetní hry o 32 kartách (8 karet z každé barvy) postupně dvě karty, jaká je pravděpodobnost, že to budou dva králi? Řešení. Máme za úkol vypočítat pravděpodobnost jevu K1 ∩ K2, kde jev K1 znamená, že první vytažená karta je král, a K2 znamená, že druhá vytažená karta je král. K řešení nejprve přistoupíme z hlediska klasické pravděpodobnosti: Všech možností pro postupné vytažení dvou karet je 32·31 a počet možností pro vytažení dvou králů je 4 · 3. Tedy P(K1 ∩ K2) = 4 · 3 32 · 31 = 3 8 · 31 . Nesprávný pokus o řešení Studenti často dělají následující chybu. Řeknou si: „Mám spočítat pravděpodobnost průniku dvou jevů. Na to je přece pěkný vzorec P(A ∩ B) = = P(A)·P(B)! Zkusíme to tedy tímto způsobem. Určíme pravděpodobnosti jednotlivých jevů, v našem případě K1 a K2. Pro pravděpodobnost K1 evidentně platí P(K1) = 4 32 = 1 8 . Pravděpodobnost K2 je také 1 8 . (Tohle někdo vidí na první pohled a někdo ne. Těm druhým je určen příklad 3.11.) Je tedy P(K1 ∩ K2) = 1 8 · 1 8 = 1 64 ??? Už jsme viděli, že ne. Problém je v tom, že jevy K1 a K2 nejsou nezávislé. Pravděpodobnost toho, že jako druhý bude vytažen král, je ovlivněna tím, jaká karta byla vytažena jako první. A proto P(K1 ∩ K2) jako P(K1) · P(K2) počítat nemůžeme. 3.1 Základní pojmy a řešené příklady 29 Správné řešení pomocí součinu Násobit přímo pravděpodobnosti jevů K1 a K2 jsme nemohli. Můžeme však použít vztah P(K1 ∩ K2) = P(K1) · P(K2/K1). P(K1) už známe, zbývá určit P(K2/K1), tj. pravděpodobnost toho, že jako druhý bude vytažen král, víme-li, že první karta byla král. Po vytažení první karty nám v balíčku zůstalo 32 − 1 karet. Protože první karta byla král, počet králů se také snížil o jednoho. Počet příznivých možností je proto 4 − 1. Tedy dostáváme P(K2/K1) = 3 31 . Dohromady pak máme P(K1 ∩ K2) = P(K1) · P(K2/K1) = 4 32 · 3 31 = 3 8 · 31 . Vidíme, že jsme došli ke stejnému výsledku jako předtím, když jsme uvažovali počty možností pro celé dvojice karet. V následujícím příkladu se mimo jiné vrátíme k výpočtu P(K2). Mohli by si jej přečíst i ti, kterým bylo hned jasné, že je to 1 8 . Příklad 3.11. Z karetní hry o 32 kartách (8 karet z každé barvy) vytáhneme postupně dvě karty. a) Jaká je pravděpodobnost, že druhá karta bude král? b) Jako druhou kartu jsme vytáhli krále. Jaká je pravděpodobnost, že král byl vytažen i jako první karta? Řešení. a) Mohly nastat dva případy: první karta král buď byla (nastal jev K1), nebo nebyla (nastal jev K1). Pravděpodobnost K2 tedy můžeme vypočítat jako součet pravděpodobností jevů K1 ∩K2 (první i druhá karta byla král) a K1 ∩K2 (první karta král nebyla a druhá byla). Pravděpodobnosti těchto průniků vypočteme podobně jako v předchozím příkladu. Celkem máme P(K2) = P(K1 ∩ K2) + P(K1 ∩ K2) = P(K1) · P(K2/K1) + P(K1) · P(K2/K1) = = 4 32 · 3 31 + 28 32 · 4 31 = 4 32 3 31 + 28 31 = 1 8 . b) Zde se po nás chce pravděpodobnost toho, že jako první byl vytažen král za podmínky, že jako druhý byl vytažen král, neboli P(K1/K2). Výpočet lze provést dvěma způsoby. Můžeme například čistě dosadit do vzorce pro podmíněnou pravděpodobnost: P(K1/K2) = P(K1 ∩ K2) P(K2) = 3 8·31 1 8 = 3 31 . Ve druhém způsobu použijeme klasickou pravděpodobnost. Víme, že druhý byl vytažen král. Počet všech možných dvojic karet, kde král je na druhém místě, dostaneme jako 30 Klasická a podmíněná pravděpodobnost součet počtů dvojic, kde král je na obou místech, a dvojic, kde první karta je jiná než král. Celkem to je 4 · 3 + 28 · 4 dvojic. Příznivé možnosti jsou ty, kde král je na prvním místě, a takovýchto možností je 4 · 3. Dohromady pak P(K1/K2) = 4 · 3 4 · 3 + 28 · 4 = 3 3 + 28 = 3 31 . V části a) tohoto příkladu jsme situaci rozdělili na dva možné případy. Pro každý z nich jsme pravděpodobnost spočítali zvlášť a příslušné pravděpodobnosti jsme pak sečetli. Někdy je možných výchozích situací víc než dvě. V takovém případě se používá věta o úplné pravděpodobnosti. V části b) jsme počítali pravděpodobnost jedné z výchozích možností, když už jsme znali celkový výsledek pokusu. Obecně se v takovémto případě může použít Bayesův vzorec. Věta o úplné pravděpodobnosti Vezměme systém navzájem disjunktních podmnožin (tzv. hypotéz) H1, . . . , Hk množiny Ω, takový že H1 ∪ · · · ∪ Hk = Ω. Pak P(A) = P(H1) · P(A/H1) + · · · + P(Hk) · P(A/Hk). Bayesův vzorec P(Hi/A) = P(Hi) · P(A/Hi) P(A) = P(Hi) · P(A/Hi) P(H1) · P(A/H1) + · · · + P(Hk) · P(A/Hk) . Příklad 3.12. Pravděpodobnost, že dítě bude trpět určitou alergií, je 0,7, jsou-li oba jeho rodiče alergici, 0,3, je-li jen jeden z rodičů alergik, a 0,1, jestliže žádný z rodičů alergií netrpí. Mezi rodiči dětí, které nyní zkoumáme, je 75 % párů, kde alergií netrpí nikdo, 20 % párů, kde má alergii jeden, a 5 % párů, v nichž mají alergii oba. a) Jaká je pravděpodobnost, že náhodně vybrané dítě bude mít alergii? b) Je-li dítě alergické, jaká je pravděpodobnost, že ani jeden z jeho rodičů alergií netrpí? Řešení. Toto je typická ukázka příkladu na úplnou pravděpodobnost (část a)) a Bayesův vzorec (část b)). Než však začneme dosazovat do nějakých vzorců, pokusme se příklad vyřešit „selským rozumem . a) Zde by nám stačilo zjistit, jaká část (kolik procent) všech zkoumaných dětí má alergii. Představme si, že bylo vyšetřeno celkem 1000 dětí. Podle zadání z nich 750 mělo oba rodiče zdravé, 200 mělo alergického jednoho z rodičů a 50 mělo oba rodiče alergiky. V zadání bylo řečeno, že například pravděpodobnost, že dítě zdravých rodičů bude mít alergii, je 0,1. To znamená, že můžeme očekávat, že ze 750 dětí se zdravými rodiči bude mít alergii 10 %, tj. 75. Podobně můžeme čekat, že 30 % z 200 dětí s jedním alergickým rodičem bude mít 3.1 Základní pojmy a řešené příklady 31 alergii. To dělá 60 dětí. Ještě zbývá 70 % z 50 dětí s oběma rodiči alergickými, tj. 35 dětí. Celkem tedy můžeme očekávat, že z 1000 dětí jich alergii bude mít 75+60+35 = 170. Když teď k problému přistoupíme z hlediska klasické pravděpodobnosti, tak pravděpodobnost, že náhodně vybereme dítě, které má alergii, bude P = 170 1000 = 0,17. Je zřejmé, že kdybychom si zvolili jiný výchozí počet dětí než 1000, dospěli bychom k témuž výsledku. Celou předcházející úvahu si můžeme i graficky znázornit pomocí stromu: Celkem 1000 ¨¨¨ ¨¨¨ rrr rrr 75% 20% 5% Rodiče: oba zdraví 750 1 alergik 200 oba alergici 50    t t tt    t t tt    t t tt 10% 90% 30% 70% 70% 30% Alergie u dítěte: ano ne ano ne ano ne 75 675 60 140 35 15 Nyní se vraťme k tomu, jak jsme vlastně ke 170 alergickým dětem dospěli. Brali jsme 10 % ze sedmdesáti pěti procent celku, 30 % z dvaceti procent celku a 70 % z pěti procent celku. Dohromady jsme tedy měli 0,75 · 0,1 + 0,2 · 0,3 + 0,05 · 0,7 = 0,17, tj. 17%. b) Když už jsme zdolali část a), je řešení snadné. Zůstaňme nejprve u konkrétního počtu 1000 dětí. Již jsme zjistili, že se dá očekávat, že z tohoto počtu bude alergických dětí 170. Nyní víme, že bylo vybráno dítě alergické. Muselo to tedy být některé z oněch 170 – zúžil se nám počet všech možností, které jsme měli na výběr. Ptáme se, jaká je pravděpodobnost, že rodiče vybraného dítěte jsou oba zdraví. Alergických dětí se zdravými rodiči je 75 – viz strom. Pravděpodobnost, že oba rodiče vybraného alergického dítěte jsou zdraví, je tedy P = 75 170 . = 0,441. Kdybychom nechtěli brát v úvahu nějaký konkrétní počet, můžeme problém řešit takto: Víme, že z celku (ať už jakéhokoli) je 17 % dětí alergických. Potřebujeme zjistit, jakou část (kolik procent) z tohoto nového celku tvoří alergické děti se zdravými rodiči. Takovýchto dětí je 10 % ze sedmdesáti pěti procent původního celku neboli 7,5 % původního celku. Výsledek je tedy opět P = 0,75 · 0,1 0,17 = 0,075 0,17 . = 0,441. 32 Klasická a podmíněná pravděpodobnost Řešení pomocí vzorců a) Otázka byla, jaká je pravděpodobnost, že náhodně vybrané dítě bude alergické. Když se nad tím člověk zamyslí, řekne si nejspíš něco ve smyslu: „To přece záleží na tom, jaké má rodiče! Máme několik možností, které mohly nastat, a při každé z nich je pravděpodobnost zkoumaného jevu jiná. Toto je klasická situace pro použití vzorce pro úplnou pravděpodobnost. Možné výchozí situace bereme jako jednotlivé hypotézy H1, H2, . . . . V našem případě to bude, zda jsou oba rodiče zdraví, jeden alergický, nebo oba alergičtí. Nyní si všechny zkoumané jevy označíme a sepíšeme jejich pravděpodobnosti. A . . . náhodně vybrané dítě je alergické H1 . . . rodiče jsou oba zdraví P(H1) = 0,75 P(A/H1) = 0,1 H2 . . . jeden z rodičů je alergik P(H2) = 0,2 P(A/H2) = 0,3 H3 . . . oba rodiče jsou alergici P(H3) = 0,05 P(A/H3) = 0,7 Dosadíme-li nyní do vzorce pro úplnou pravděpodobnost, dostáváme P(A) = P(H1) · P(A/H1) + P(H2) · P(A/H2) + P(H3) · P(A/H3) = = 0,75 · 0,1 + 0,2 · 0,3 + 0,05 · 0,7 = 0,17. Porovnejte s předchozím („selským ) řešením! b) V tomto případě si člověk možná řekne: „To je divná otázka, jaksi pozpátku. . . Jó, kdyby to bylo naopak – když má dítě oba rodiče zdravé, tak jaká je pravděpodobnost, že bude alergické – tak to bych věděl! Tohle je typická situace pro použití Bayesova vzorce. Známe už výsledek pokusu a chceme zjistit pravděpodobnost jedné z možných výchozích situací. Při našem označení jevů máme vypočítat pravděpodobnost hypotézy H1 za podmínky, že nastal jev A. Použitím Bayesova vzorce dostáváme P(H1/A) = P(H1) · P(A/H1) P(A) = 0,75 · 0,1 0,17 . = 0,441. Opět porovnejte se „selským řešením! Příklad 3.13. Zuzanka má dva pytlíky s kuličkami. V prvním je pět bílých a šest zelených kuliček a ve druhém jsou čtyři bílé a sedm zelených kuliček. Označme U1−výběr kuliček z prvního pytlíku, U2−výběr ze druhého pytlíku, B−výběr bílé kuličky, Z−výběr zelené kuličky. Víme, že výběr z prvního a druhého pytlíku je stejně pravděpodobný. Vypočítejte P(B/U1), P(B/U2), P(Z/U1), P(Z/U2), P(B ∩ U1), P(B ∩ U2), P(B). Řešení. Výpočet prvních čtyř pravděpodobností je jednoduchý. Je třeba si uvědomit, co vlastně například P(B/U1) znamená. Je to pravděpodobnost toho, že za předpokladu výběru z prvního pytlíku vytáhneme bílou kuličku. Představme si to tak, že už máme ruku v prvním pytlíku a ptáme se jen na to, jaká je pravděpodobnost, že vytáhneme bílou kuličku. V prvním pytlíku je 11 kuliček, z toho pět bílých, a tedy P(B/U1) = 5 11 . Podobně spočítáme, že P(B/U2) = 4 11 , 3.1 Základní pojmy a řešené příklady 33 P(Z/U1) = 6 11 = 1 − P(B/U1), P(Z/U2) = 7 11 = 1 − P(B/U2). Další jev (B ∩U1) znamená, že vybírám bílou kuličku z prvního pytlíku, tedy že si vyberu správný pytlík (první) a pak z něj ještě musím vytáhnout bílou kuličku. Protože výběr z prvního a z druhého pytlíku je stejně pravdepodobný a tyto dva jevy jsou neslučitelné, je pravděpodobnost toho, že vyberu kuličku z prvního pytlíku P(U1) = 1 2 . A teď, když už s pravděpodobností 1 2 je naše ruka v prvním pytlíku, stačí vytáhnout bílou kuličku, a to lze s pravděpodobností 5 11 . Proto P(B ∩ U1) = 1 2 · 5 11 = 5 22 ˙=0,227 a podobně P(B ∩ U2) = 1 2 · 4 11 = 4 22 ˙=0,182. Všimněte si, že jsme vlastně použili vzorec pro výpočet průniku dvou jevů pomocí podmíněné pravděpodobnosti. Zkuste si rozmyslet, jestli se ke druhému výsledku nedalo dojít jiným způsobem. Zůstává spočítat poslední pravděpodobnost. K tomu si stačí uvědomit, že bílou kuličku můžeme vybrat z prvního nebo druhého pytlíku a tyto jevy jsou neslučitelné, proto P(B) = P(B ∩ U1) + P(B ∩ U2) = 4 + 5 22 . = 0,409. Na závěr se ještě vraťme k poslednímu výsledku. Když sečteme bílé kuličky z obou pytlíků, dostaneme číslo 9, a počet všech kuliček je 22. Častý dotaz studentů je, proč jsme tu pravděpodobnost nespočítali hned jako podíl počtu bílých kuliček ku počtu všech kuliček. Proč? Z jediného důvodu, není to obecný postup. V tomto konkrétním příkladu je to možné a korektní řešení. Zkuste si ale vypočítat tuto úlohu s jedinou úpravou – předpokládejte, že pravděpodobnost výběru z prvního pytlíku je například dvakrát větší než výběr z druhého pytlíku. Pak se ještě zamyslete nad tím, kdy si výpočet poslední pravděpodobnosti můžeme zjednodušit a kdy to nesmíme udělat. Příklad 3.14. Studenti jsou rozděleni do tří stejně početných skupin. Jistého testu se zúčastnilo 40 % studentů z první skupiny, 30 % studentů ze druhé skupiny a 30 % studentů ze třetí skupiny. Víme, že studenti z první skupiny mívají na testech úspěšnost 60 %, studenti ze druhé skupiny mívají úspěšnost 35 % a ze třetí skupiny 70 %. Učitel si náhodně vybere jeden test a začne jej opravovat. a) Jaká je pravděpodobnost, že opravuje úspěšný test? b) Opravuje úspěšný test. Jaká je pravděpodobnost, že ho psal student z první skupiny? Řešení. (Upozorňujeme, že trochu lehkomyslné – pokuste se najít ono podezřelé místo. Pozorně si pak přečtěte i další příklad.) a) Úspěšný test mohl napsat student z první, druhé nebo třetí skupiny a tyto tři jevy jsou neslučitelné. Pak si stačí uvědomit, že pravděpodobnost, že opravujeme úspěšný test, který psal student z první skupiny, je P(U ∩ S1) = 0,4 · 0,6. Podobně spočítáme další 34 Klasická a podmíněná pravděpodobnost dvě pravděpodobnosti (P(U ∩S2), P(U ∩S3)). Pravděpodobnost P(U) napsání úspěšného testu je tedy P(U) = 0,4 · 0,6 + 0,3 · 0,35 + 0,3 · 0,7 = 0,555. b) Potřebujeme vypočítat pravděpodobnost toho, že test psal student z první skupiny, za přepokladu, že vybraný test je úspěšný. Můžeme použít Bayesův vzorec a využijeme výsledek části a). P(S1/U) = P(S1 ∩ U) P(U) , P(S1/U) = 0,4 · 0,6 0,555 . = 0,4332. Následující příklad je na první pohled stejný, ale pozor, je mírně zákeřný. Příklad 3.15. Tentokrát se testu zúčastnilo 60 % studentů z první skupiny, 50 % studentů ze druhé skupiny a 70 % studentů ze třetí skupiny. Víme, že studenti z první skupiny mívají na testech úspěšnost 60 %, studenti ze druhé skupiny mívají úspěšnost 35 % a ze třetí skupiny 70 %. Učitel si opět náhodně vybere jeden test. a) Jaká je pravděpodobnost, že opravuje úspěšný test? b) Test je úspěšný. Jaká je pravděpodobnost, že ho psal student z první skupiny? Pokus o řešení (bohužel nevydařený) a) Podobně jako v předchozím příkladu spočítáme pravděpodobnost úspěšného testu: P(U) = 0,6 · 0,6 + 0,5 · 0,35 + 0,7.0,7 = 1,025. Výsledek nemůže být správný, možné hodnoty pravděpodobnosti jsou vždy z intervalu 0, 1 . Kde jsme udělali chybu? Je vůbec předešlý příklad správně vyřešen? Jaký je rozdíl mezi tímto a předešlým příkladem? A konečně správné řešení Všimněte si počtů procent zúčastněných studentů z jednotlivých skupin. Jejich součet v prvním příkladu je 100 %, ve druhém je součet 180 %. (Pozor! V zadání chyba není.) Chyba nastala v řešení druhého příkladu při určení pravděpodobností P(U ∩ S1), P(U ∩ S2), P(U ∩ S3), přesněji v určení pravděpodobností P(S1), P(S2), P(S3). Už v prvním příkladu jsme tyto pravděpodobnosti určili poněkud unáhleně, ovšem tam jsme měli štěstí. Nyní jsme například za pravděpodobnost jevu, že student je z první skupiny, brali číslo 0,6, a to byla chyba. Totiž součet pravděpodobností neslučitelných jevů (student může patřit jenom do jedné ze tří skupin) musí být 1. V našem nesprávném řešení je tento součet 0,6 + 0,5 + 0,7 = 1,8 > 1. Proto potřebujeme tyto pravděpodobnosti znormovat, upravit je tak, aby poměr zůstal stejný, ale součet byl roven 1. Proto P(S1) = 0,6 1,8 , P(S2) = 0,5 1,8 , P(S3) = 0,7 1,8 . Takže jaký je rozdíl mezi prvním a druhým příkladem už víme a zřejmě je už jasné i to, že první příklad jsme řešili správně (i když možná víceméně náhodou). Oba příklady jsme uvedli záměrně, aby si studenti uvědomili, že není možné bez přemýšlení použít vzoreček. A teď už to správné řešení: a) P(U) = 0, 6 1, 8 · 0,6 + 0, 5 1, 8 · 0,35 + 0, 7 1, 8 · 0,7 . = 0,569. 3.2 Příklady pro samostatnou práci 35 b) P(S1/U) = P(S1 ∩ U) P(U) , P(S1/U) = 0,6 1,8 · 0,6 P(U) . = 0,351. Vyzkoušejte si část b) spočítat s nesprávnými hodnotami P(U ∩S1), P(U ∩S2), P(U ∩S3) a výsledek porovnejte s naším. Porovnání je moc zajímavé, tak si to zkuste! 3.2 Příklady pro samostatnou práci Přímý výpočet pravděpodobnosti Příklad 3.16. Hloupý Honza si má vybrat princeznu. Předvedli mu 6 zamaskovaných ježibab, 3 zamaskované komorné a 2 princezny. Jaká je pravděpodobnost, že Honza vybere princeznu? Výsledek: 2 11 Příklad 3.17. Házíme třikrát šestistěnnou kostkou. Jaká je pravděpodobnost, že součet bude a) sudé číslo, b) prvočíslo, c) číslo dělitelné 3, d) osm, e) větší než 12? Výsledek: a) 0.5, b) 73 216 , c) 1 3 , d) 21 216 , e) 7 27 . Příklad 3.18. Házíme třemi šestistěnnými kostkami. Který ze součtů je pravděpodobnější, 11, nebo 12? Výsledek: Pravděpodobnější je součet 11. Příklad 3.19. Házíme třikrát šestistěnnou kostkou. Jaká je pravděpodobnost, že součet bude 9, když víme, že na při prvním hodu padla dvojka? Výsledek: 1 6 Příklad 3.20. Zuzanka si hraje s písmenky A, A, A, E, I, K, M, M, T, T. Jaká je pravděpodobnost, že při náhodném uspořádaní písmen dostane slovo MATEMATIKA? Výsledek: 1 151 200 Příklad 3.21. Číslice 1, 2, 3, 4, 5 jsou napsané na pěti kartách. Náhodně vybereme tři karty a naskládáme je vedle sebe v tom pořadí, v jakém jsme je vybrali. Vypočítejte pravděpodobnost toho, že takto vzniklé trojciferné číslo bude sudé. Výsledek: 0,4 36 Klasická a podmíněná pravděpodobnost Příklad 3.22. Ze 32 hracích karet vybíráme dvakrát po sobě po jedné kartě. Zjistěte a) jaká je pravděpodobnost, že obě karty jsou esa, když jsme první kartu nevrátili, b) jaká je pravděpodobnost, že obě karty jsou esa, když jsme první kartu vrátili, c) jaká je pravděpodobnost, že obě karty jsou stejné barvy, když jsme první kartu nevrátili, d) jaká je pravděpodobnost, že obě karty jsou stejné barvy, když jsme první kartu vrátili. Výsledek: a) přibližně 0,012, b) přibližně 0,015625, c) přibližně 0,2258, d) přibližně 0,25. Příklad 3.23. Ze 32 hracích karet (z toho 4 jsou esa) vybíráme postupně po jedné kartě, žádnou kartu nevrátíme zpátky. Zjistěte, jaká je pravděpodobnost, že a) pátá karta bude eso, b) první eso bude vytaženo jako pátá karta v pořadí. Výsledek: a) 1 8 = 0,125, b) přibližně 0,081 Příklad 3.24. Krychli, která má nabarvené všechny stěny, rozřežeme na 1000 malých krychlí stejných rozměrů. Všechny pomícháme a náhodně vybereme jednu malou krychli. Vypočítejte, jaká je pravděpodobnost, že krychle bude mít a) jednu zabarvenou stěnu, b) dvě zabarvené stěny, c) tři zabarvené stěny, d) všechny stěny nezabarvené. Výsledek: a) přibližně 0,384, b) přibližně 0,096, c) přibližně 0,008, d) přibližně 0,512. Příklad 3.25. Vypočtěte pravděpodobnost, že ve Sportce sázející a) vyhraje 2. cenu, b) vyhraje, ale nanejvýš 3. cenu. Výsledek: a) (6 5)·(43 1 ) (49 6 ) . = 1,84 · 10−5 , b) (6 4)·(43 2 ) (49 6 ) + (6 3)·(43 3 ) (49 6 ) . = 1,86 · 10−2 Příklad 3.26. Jaký počet uhodnutých čísel ve Sportce je nejpravděpodobnější? Výsledek: Intuice napovídá a výpočet to potvrzuje, že 0 – příslušná pravděpodobnost je přibližně 0,436, pro jedno číslo 0,413, ostatní už jsou daleko menší. Příklad 3.27. 40 procent myší se stává minutu po podání léku vysoce agresivními. Určete pravděpodobnost toho, že pokud 15 myším bude podán lék, tak minutu po podání budou agresivní nanejvýš 3 z nich. Výsledek: přibližně 0,0905019. Příklad 3.28. Test sestává z 8 otázek, u každé z nich je z variant a,b,c správná právě jedna. Jeden student se na test nepřipravil, místo toho háže kostkou u každé otázky. Pokud padne 1 nebo 2, zatrhne variantu a, pokud padne 3 nebo 4, variantu b, pokud 5 nebo 6, variantu c. Určete pravděpodobnost, že bude po opravení testu mít aspoň šest otázek správně. Výsledek: 129 38 . = 0,01966 3.2 Příklady pro samostatnou práci 37 Příklad 3.29. Vykonal se experiment, který spočíval v křížení bílého a fialového hrachu, přičemž se předpokládalo, že pokusné rostliny kříženy dosud nebyly. Podle pravidel dědičnosti lze očekávat, že 3 4 nových potomků rozkvetou fialově a 1 4 bíle. Vzklíčilo 10 rostlin. Určete pravděpodobnost toho, že a) ani jedna rostlina nerozkvete bíle, b) fialově rozkvetou alespoň tři, c) fialově rozkvete alespoň 6, ale nanejvýš 8 rostlin. Výsledek: a) přibližně 0,0563, b) přibližně 0,9996, c) přibližně 0,6779. Příklad 3.30. Dva sportovní střelci střílejí nezávisle na sobě na stejný cíl, každý jednu střelu. Pravděpodobnost, že cíl zasáhne první střelec, je 0,9 a druhý 0,8. Vypočítejte pravděpodobnost, že cíl nezasáhne ani jeden střelec. Výsledek: 0,002. Příklad 3.31. Mezi 10 kvalitních výrobků bylo omylem přimícháno 5 zmetků (máme 15 výrobků). Náhodně vybereme tři výrobky. Určete pravděpodobnost toho, že a) všechny budou kvalitní, b) právě jeden bude chybný, c) minimálně jeden bude chybný. Výsledek: a) přibližně 0,264, b) přibližně 0,538, c) přibližně 0,736. Příklad 3.32. Jaká je pravděpodobnost toho, že tři náhodně vybraní lidé nemají narozeniny ve stejný den i měsíc (29. únor neuvažujeme). Výsledek: přibližně 0,9917. Příklad 3.33. V pytlíku máme 8 kuliček – 3 červené a 5 modrých. Náhodně vybereme dvě kuličky (naráz). Co je pravděpodobnější: že vybereme dvě modré, modrou a červenou, nebo dvě červené kuličky? Výsledek: Nejpravděpodobnější je výběr modré a červené kuličky. Příklad 3.34. Ke zkoušce je zadáno 30 otázek. Student si vylosuje dvě. Zkoušku udělá, jestliže obě dvě umí. Lojza se chystá na zkoušku, ale nehodlá se předřít. a) Kolik otázek se musí naučit, aby měl nadpoloviční šanci, že u zkoušky uspěje? b) Kolik by se musel naučit, aby pravděpodobnost úspěchu nebyla menší než 90%? Výsledek: a) 22 b) 29 Příklad 3.35. Ke zkoušce je zadáno 30 otázek, po deseti z každého ze tří okruhů, z nichž se předmět skládal. Student si vylosuje z každého okruhu jednu otázku. Zkoušku udělá, jestliže umí všechny tři. Kolik otázek se musí student naučit z každého okruhu, aby měl nadpoloviční šanci, že u zkoušky uspěje? Výsledek: 8 38 Klasická a podmíněná pravděpodobnost Podmíněná pravděpodobnost, nezávislost jevů Příklad 3.36. Házíme klasickou šestistěnnou kostkou. a) Víme, že padlo sudé číslo. Jaká je pravděpodobnost, že padla dvojka? b) Víme, že padla dvojka. Jaká je pravděpodobnost, že padlo sudé číslo? Výsledek: a) 1 3 b) 1 Příklad 3.37. Jistý předmět učí tři profesoři: Hodný, Zlý a Střední. Profesor Hodný učí stejný počet studentů jako profesor Střední. Profesor Zlý učí poloviční počet studentů než profesor Hodný. Profesor Hodný vyhazuje 20 % studentů, profesor Střední 30 % a profesor Zlý 60 %. a) Jaká je pravděpodobnost, že náhodně vybraný student neudělá zkoušku? b) Jestliže byl student od zkoušky vyhozen, jaká je pravděpodobnost, že ji dělal u profesora Zlého? Výsledek: a) 0,32 b) 0,375 Příklad 3.38. Přibližně jedno z 10000 dětí se narodí s určitou vrozenou vadou (která se projeví až později). Na včasné odhalení této vady lékaři vyvinuli test, který správně funguje s pravděpodobností 0,99, pokud dítě tuto vadu opravdu má. Jestliže je dítě zdravé, je zde pravděpodobnost 0,05, že bude chybně prohlášeno za nemocné. a) Jaká je pravděpodobnost, že vyšetřované dítě bude označeno jako nemocné? b) Dítě bylo označeno za nemocné. Jaká je pravděpodobnost, že nemocné opravdu je? Výsledek: a) 0,050094 b) 0,0001 · 0,99/0,050094 . = 0,002 Příklad 3.39. Pravděpodobnost, že se tenistovi podaří první podání, je 0,6. U druhého podání má pst úspěchu 0,9. (Druhé podání dává jedině v případě, že se mu první nepo- dařilo.) a) Tento „pokus má tři možné výsledky: tenista může uspět buď při prvním podání, nebo při druhém podání, nebo udělá dvojchybu. Vypočtěte pravděpodobnosti jednotlivých možností. b) Jaká je pravděpodobnost, že se mu podání podaří? c) Podání se podařilo. Jaká je pravděpodobnost, že to bylo až na druhý pokus? Výsledek: a) 1. podání: 0,6; 2. podání: 0,36; dvojchyba: 0,04 b) 0,96 c) 0,36/0,96 = 0,375 Příklad 3.40. Studenti jsou rozděleni do tří skupin, přičemž první a druhá skupina jsou stejně početné, zatímco třetí skupina je dvojnásobné velikosti než první. Jistého testu se zúčastnilo 40 % studentů z první skupiny, 25% studentů ze druhé skupiny a 30 % studentů ze třetí skupiny. Víme, že studenti z první skupiny mívají na testech úspěšnost 60 %, studenti ze druhé skupiny mívají úspěšnost 35 % a ze třetí skupiny 70 %. Učitel si náhodně vybere jeden test a začne jej opravovat. a) Jaká je pravděpodobnost, že opravuje úspěšný test? b) Opravuje úspěšný test. Jaká je pravděpodobnost, že ho psal student ze druhé skupiny? Výsledek: a) 0,598 b) přibližně 0,117 3.2 Příklady pro samostatnou práci 39 Příklad 3.41. V jedné dílně pracují Ruda Rychlý, Pepa Pečlivý a Lojza Lajdák. Ruda za den vyrobí dvakrát víc výrobků než Pepa a Pepa třikrát víc výrobků než Lojza. Z toho, co vyrobí Ruda, je 10 % zmetků, mezi Pepovými výrobky je 5 % zmetků a z Lojzových výrobků je zmetků polovina. Jestliže náhodně vybraný výrobek z této dílny je zmetek, kdo je jeho nejpravděpodobnějším autorem? A kdo nejméně pravděpodobným? Výsledek: Pravděpodobnosti autorství zmetku pro Rudu, Pepu a Lojzu jsou po řadě 0,48, 0,12 a 0,4. Nejpravděpodobnějším výrobcem zmetku je Ruda, nejméně pravděpodobným Pepa. Příklad 3.42. Lovec vystřelí na medvěda. Pravděpodobnost zásahu je 0,4. Jestliže medvěda netrefí, rozzuřené zvíře na lovce zaútočí. Lovec vystřelí znovu, tentokrát má pravděpodobnost zásahu p. Jestliže medvěda nezasáhne ani tentokrát, medvěd jej sežere. Určete hodnotu p tak, aby šance lovce a medvěda byly vyrovnané, tj. aby pravděpodobnosti, že medvěd bude zastřelen a že lovec bude sežrán, byly obě rovny 0,5. Výsledek: p = 1/6 – vyjde jako řešení rovnice 0,4 + 0,6 · p = 0,5 nebo 0,6 · (1 − p) = 0,5. Příklad 3.43. Učitel vybral náhodně test ze skupiny 5 těžkých a 2 lehkých testů. Poradí se s kolegou–expertem, který na první pohled rozezná těžký test s pravděpodobnosti 3 4 a s pravděpodobnosti 1 4 označí i lehký test za těžký. Určete pravděpodobnost, že kolega označí vybraný test za těžký. Výsledek: 17 28 . Příklad 3.44. Zuzanka má panenku Chou Chou. K této panence patří lahvička, na kterou ona reaguje. Baruška má panenku Baby Born a ta má stejnou lahvičku, na kterou ale Zuzančina panenka nereaguje. Holčičky si lahvičky pomíchaly a každá tu svou dokáže určit s pravděpodobností 1 2 . Zuzanka má v ruce lahvičku, o které tvrdí, že je její. S jakou pravděpodobností bude Chou Chou na ni reagovat? Výsledek: 0,5. Příklad 3.45. Zákazník si vybírá obraz ze skupiny 10 originálů a 2 kopií. Radí se s expertem, který rozezná originál od kopie s pravděpodobností 5 6 . Odborník právě tvrdí, že obraz je originál. Jaká je pravěpodobnost, že obraz je opravdu originál? Výsledek: přibližně 0,96. Příklad 3.46. V tramvaji si povídají dva studenti o tom, kdo byl na zkoušce. „Dnes bylo 8 z kombinace M-F a 4 z kombinace M-CH. „Kolik jich to udělalo? „Pět z M-F a tři z M-CH. „A co Eva? „Eva udělala. Student matematiky si to vyslechl, ale Evu nezná. Začal řešit, s jakou pravděpodobností je Eva z kombinace M-F. Zkuste si to taky spočítat. Výsledek: přibližně 0,625. 40 Klasická a podmíněná pravděpodobnost Příklad 3.47. Na stavbu přivezli cihly ze čtyř cihelen v poměru 1 : 2 : 3 : 4. Jednotlivé cihelny vyrábějí kvalitní cihly s pravděpodobností v pořadí: 0,7; 0,6; 0,8; 0,9. a) Jaká je pravděpodobnost, že náhodně vybraná cihla bude kvalitní? b) V ruce mám kvalitní cihlu. Jaká je pravděpodobnost, že je ze třetí cihelny? Výsledek: a) 0,79, b) 24 79 Příklad 3.48. Zuzanka má tři balíčky bonbónů: karamelové, jahodové a čokoládové. Neposlušný Kamílek bonbónky promíchá a některé i sní, a tak nakonec v prvním balíčku je pět karamelových, jeden jahodový a dva čokoládové bonbónky, ve druhém balíčku je jeden karamelový, šest jahodových a jeden čokoládový a ve třetím balíčku jsou dva karamelové, jeden jahodový a šest čokoládových bonbónků. Pravděpodobnost, že bude Zuzanka hledat bonbón v prvním balíčku je 0,8, a pravděpodobnost hledání bonbónků ve druhém a třetím balíčku je stejná, tedy 0,1. Jaká je pravděpodobnost toho, že Zuzanka vybere karamelový bonbón? Výsledek: 77 144 Příklad 3.49. Zuzanka má tři balíčky barevných míčků: červené, modré a žluté. Neposlušný Kamílek míčky promíchá, takže nakonec v prvním balíčku je 20 červených, 8 modrých a 8 žlutých, v druhém balíčku 5 červených, 15 modrých a 16 žlutých a ve třetím balíčku je 11 červených, 13 modrých a 12 žlutých míčků. Pravděpodobnost, že Zuzanka vybere míček z prvního balíčku je 0,6, a pravděpodobnost vytažení míčků ze druhého a třetího balíčku je stejná, tedy 0,2. Jaká je pravděpodobnost toho, že Zuzanka vybere červený míček? Výsledek: 19 45 Příklad 3.50. Do textilní galanterie přivezli vlnu ze čtyř pletařských závodů v poměru 1 : 2 : 3 : 4. Pravděpodobnost toho, že vlna z jednotlivých závodů je kvalitně zabarvena, je po řadě 0,7, 0,6, 0,8 a 0,9. Určete pravděpodobnost toho, že náhodně vybrané klubíčko je kvalitně zabarveno. Výsledek: 0,79. Příklad 3.51. Na stavbu přivezli cihly ze čtyř cihelen v poměru 2 : 5 : 4 : 6. Jednotlivé cihelny vyrábějí kvalitní cihly s pravděpodobností v pořadí: 0,7; 0,6; 0,8; 0,9. a) Jaká je pravděpodobnost, že náhodně vybraná cihla bude kvalitní? b) V ruce mám kvalitní cihlu. Jaká je pravděpodobnost, že je ze třetí cihelny? Výsledek: a) 13 17 , b) 32 130 . Příklad 3.52. Do Tesca přivezli cukr ze tří balíren v poměru 2 : 3 : 5. Pravděpodobnost toho, že cukr z první balírny je kvalitně zabalen (nesype se z balíku), je 0,7, pravděpodonost, že cukr ze druhé a třetí balírny je kvalitně zabalen, je po řadě 0,8 a 0,9. Určete pravděpodobnost toho, že náhodně vybraný balíček cukru je kvalitně zabalen. Výsledek: 0,83. Příklad 3.53. * Pan Šťastný vyhrál ve Sportce. Vypočtěte pravděpodobnost, že to byla 1. cena. (Pozor, toto není totéž jako příklad 3.7 a).) 3.2 Příklady pro samostatnou práci 41 Výsledek: P(1. cena/vyhrál) = 6 6 / 6 6 + 6 5 · 43 1 + 6 4 · 43 2 + 6 3 · 43 3 . = 3,84 · 10−6 Příklad 3.54. * Princ se vydal vysvobodit princeznu Zlatovlásku, kterou drží v zajetí zlý čaroděj. Čaroděj prince vlídně přivítá a řekne mu: „Dám ti Zlatovlásku, pokud ji dokážeš rozeznat. A ukáže mu tři zahalené postavy. Princi bohužel nepomůže žádná zlatá muška, ani „hlas srdce mu tentokrát nic nenapovídá. Proto zcela náhodně vybere jednu z postav: „Je to tahle! Verze A: Princ má s sebou svého věrného mluvícího koně Zlatohříváka, a ten praví: „Pane, vyberte si radši tuhle. A ukáže na jinou dívku. Zlatohřívák ovšem kromě daru řeči žádné další magické schopnosti nemá a vybral také zcela náhodně. Čaroděj vše zlomyslně sleduje a pak odhalí zbývající, nevybranou dívku. Všichni vidí, že to Zlatovláska není. Princ se nyní musí definitivně rozhodnout mezi svou původní volbou a volbou koně Zlatohříváka. Otázka: Co je nadějnější? Jeho původní volba, volba koně, nebo je to jedno? Verze B: Čaroděj, který samozřejmě velice dobře ví, která z dívek je Zlatovláska, chce prince pokoušet a řekne: „Vida, tuhle sis vybral. Možná je to ta pravá a možná také ne. Podívejme se... Přistoupí k jedné z nevybraných dívek a odhalí ji. Zlatovláska to není. Kromě dívky, kterou si princ vybral, teď zbývá ještě jedna. „Nechceš si to ještě rozmyslet? Není to třeba tahle? naléhá čaroděj na prince. Otázka: Co má princ udělat? Zůstat u své původní volby, nebo dát na radu čaroděje? Nebo je to jedno? Je nějaký rozdíl mezi verzemi A a B? Výsledek: Verze A: Je to jedno, pro obě dívky je teď pravděpodobnost, že je to Zlatovláska, 1/2. Verze B: Předpokládejme, že čaroděj se absolutně nevyzná v pravděpodobnosti, o matematických aspektech problému vůbec nepřemýšlí a že chce prince prostě trápit. V tom případě ovšem čaroděj dělá chybu, protože princovy šance na úspěch zvyšuje. Jak? Když si princ zvolil jednu z dívek, pravděpodobnost, že je to Zlatovláska, byla 1/3. To znamená, že pravděpodobnost, že Zlatovláska je jedna ze zbývajících dívek, byla 2/3. Čaroděj ví, která je Zlatovláska, takže když jednu z dívek odhaluje, jde najisto (na rozdíl od koně Zlatohříváka ve verzi A). Vybere tu, která zaručeně Zlatovláska není. To ale znamená, že pravděpodobnost 2/3 zůstává pro dívku, která je ještě zahalená a kterou princ nevybral. Jestliže se tedy princ vyzná v pravděpodobnosti, změní svou volbu a vybere si dívku, kterou mu nabízí čaroděj – bude mít dvakrát větší šanci na úspěch. Jiná situace by ovšem nastala, kdybychom předpokládali, že čaroděj se v pravděpodobnosti vyzná, a začali celou věc rozebírat z psychologického hlediska. Do toho se však raději pouštět nebudeme. Obáváme se, že už předvedené čistě matematické řešení dokázalo mnoha lidem zamotat hlavu. 42 Diskrétní náhodná veličina 4 Diskrétní náhodná veličina 4.1 Základní pojmy a řešené příklady Zatím jsme zkoumali výsledky náhodných procesů, které jsme popisovali slovně, např. „na kostce padla šestka . Nyní se zaměříme na náhodné procesy, jejichž výsledek se dá popsat pomocí čísla, obvykle přirozeného. Náhodná veličina (náhodná proměnná) Náhodná veličina (nebo též náhodná proměnná) je veličina X, jejíž hodnota je jednoznačně určena výsledkem náhodného pokusu. Například počet kvalitních výrobků ve vyrobené denní dávce 100 ks je náhodná veličina X, která může nabýt hodnoty x = 0, 1, 2, ..., 100. Diskrétní náhodná veličina Náhodná veličina (proměnná) X se nazývá diskrétní, jestliže její obor hodnot (množina všech čísel, kterým se X může rovnat) je nanejvýš spočetná množina. To znamená, že X se buď může rovnat jen konečně mnoha hodnotám, nebo sice nekonečně mnoha hodnotám, ale tyto hodnoty lze seřadit do posloupnosti. Hodnoty, kterých diskrétní náhodná veličina může nabývat, označíme x1, x2, . . . a jejich počet označíme n, přičemž n může být i ∞. Příkladem diskrétní náhodné veličiny s konečným oborem hodnot je např. součet ok při hodu dvěma kostkami. Příkladem diskrétní náhodné veličiny s nekonečným oborem hodnot je např. počet hodů mincí, než poprvé padne líc. Příkladem náhodné veličiny, která není diskrétní, je doba, po které přijde do obchodu další zákazník – takováto náhodná veličina (kdybychom mohli měřit s dokonalou přesností a nezaokrouhlovali např. na sekundy) by mohla nabýt jakékoli hodnoty z intervalu (0, ∞), což je množina nespočetná – její prvky nelze uspořádat do posloupnosti. 4.1 Základní pojmy a řešené příklady 43 Pravděpodobnostní funkce Pravděpodobnostní funkce diskrétní náhodné veličiny X je funkce p, která je definována jako p(x) = P(X = x). (Čteme: „Hodnota funkce malé p v bodě malé x je rovna pravděpodobnosti, že náhodná veličina velké X se bude rovnat malému x. ) Pro hodnoty pravděpodobnostní funkce platí n i=1 p(xi) = 1. Dále se k popisu náhodných veličin používá distribuční funkce. Distribuční funkce Distribuční funkce náhodné veličiny X je funkce F, která je definována jako F(x) = P(X ≤ x). (Čteme: „Hodnota funkce F v bodě malé x je rovna pravděpodobnosti, že náhodná veličina velké X nabude hodnoty menší nebo rovné malému x, tj. hodnoty z intervalu (−∞, x . ) Pro distribuční funkci diskrétní náhodné veličiny platí F(x) = xi≤x p(xi). Distribuční funkce má tyto základní vlastnosti: Je neklesající, zprava spojitá a lim x→−∞ F(x) = 0, lim x→∞ F(x) = 1. U diskrétní veličiny je distribuční funkce schodového tvaru – jedná se o funkci, která je po částech konstantní (na intervalech (xi, xi+1)), pouze v bodech x1, x2, x3, . . . dochází ke změně (ke schodu), kde velikost změny (= výška schodu) v bodě xk je rovna právě hodnotě p(xk). Body vyznačené na pravém konci každého ze schodů prázdným kolečkem naznačují, že funkční hodnota distribuční funkce v bodě skoku je definována ne v bodě prázdného kolečka, ale až výše, na úrovni dalšího schodu – viz obrázek 4.1. Příklad 4.1. Zuzanka má pytlík s kuličkami. Jsou v něm 3 bílé a 2 červené kuličky. Zuzanka vytahuje náhodně kuličky, po vytažení je do pytlíku nevrací. Své výběry ukončí, když vytáhne červenou kuličku. Náhodná veličina X udává počet tažení. Určete její rozdělení a distribuční funkci. Řešení. Zřejmě X ∈ {1, 2, 3, 4}, Zuzanka může červenou kuličku vytáhnout napoprvé (1 tažení), napodruhé (vytáhne bílou kuličku a až pak červenou), napotřetí (dvakrát vytáhne 44 Diskrétní náhodná veličina bílou kuličku a pak červenou) nebo napočtvrté (postupně vytáhne všechny tři bílé kuličky a pak vytáhne jednu červenou). Jaká je pravděpodobnost, že napoprvé vytáhne červenou kuličku? Všech možností (tedy počet všech kuliček v pytlíku) je pět, zatímco příznivé možnosti (červené kuličky) jsou dvě. Proto p(1) = 2 5 = 0,4. Pro výpočet p(2) uvažujeme následovně: Zuzanka nejdřív vytáhne bílou kuličku (všech kuliček je pět a bílé jsou tři, tedy pravděpodobnost je 3 5 ) a pak vytáhne ze zbylých čtyř kuliček (tu vytaženou bílou už nevrací) jednu červenou kuličku (pravděpodobnost je 2 4 ). Potom p(2) = 3 5 · 2 4 = 3 10 = 0,3. Podobně zjistíme, že p(3) = 3 5 · 2 4 · 2 3 = 1 5 = 0,2. Nejdřív z pěti kuliček (tří bílých a dvou červených) taháme bílou, pak ze zbylých čtyř (dvou bílých a dvou červených) taháme opět bílou a nakonec ze tří kuliček (jedné bílé a dvou červených) vytáhneme červenou. A na závěr p(4) = 3 5 · 2 4 · 1 3 · 2 2 = 1 10 = 0,1. Pro kontrolu ještě spočítáme součet p(1) + p(2) + p(3) + p(4) = 0,4 + 0,3 + 0,2 + 0,1 = 1,0. Teď budeme zkoumat distribuční funkci. Nejprve vypočteme její hodnoty v „zajímavých bodech – v těch, kterým se náhodná veličina X může rovnat. Podle definice je F(1) = P(X ≤ 1). Určujeme tedy pravděpodobnost, že Zuzanka vytáhne nanejvýš jednu kuličku. To v našem případě znamená, že vytáhne právě jednu, takže F(1) = P(X ≤ 1) = P(X = 1) = p(1) = 0,4. Dále, F(2) = P(X ≤ 2), tj. jedná se o pravděpodobnost, že Zuzanka vytáhne nanejvýš 2 kuličky neboli že vytáhne jednu nebo dvě. To dává F(2) = P(X ≤ 2) = P(X = 1) + P(X = 2) = p(1) + p(2) = 0,4 + 0,3 = 0,7. F(3) bude pravděpodobnost, že Zuzanka vytáhne nanejvýš 3 kuličky: F(3) = P(X ≤ 3) = p(1) + p(2) + p(3) = 0,4 + 0,3 + 0,2 = 0,9. Podobně pak F(4) = P(X ≤ 4) = p(1) + p(2) + p(3) + p(4) = 1. Nyní se podíváme, jak bude vypadat distribuční funkce v jiných bodech. Je zřejmé, že pro x < 1 bude F(x) = 0: Zuzanka např. nemůže vytáhnout nanejvýš −1 kuličku. Pro x > 4 4.1 Základní pojmy a řešené příklady 45 bude naopak F(x) = 1: např. F(5) je z definice P(X ≤ 5) a Zuzanka vytáhne určitě méně než 5 kuliček. Je-li x ∈ (1, 2), např. x = 1,5, počítáme pravděpodobnost, že Zuzanka vytáhne nanejvýš „jedna a něco kuličky. To je možné jedině tak, že vytáhne právě jednu, a tedy F(x) = = p(1) = 0,4. To znamená, že distribuční funkce je na tomto intervalu stejná jako pro x = 1. Podobně pro x ∈ (2, 3) dostaneme stejnou hodnotu jako F(2), atd. Celkem pro F(x) dostáváme F(x) =    0 pro x ∈ (−∞, 1), 0,4 pro x ∈ 1, 2), 0,7 pro x ∈ 2, 3), 0,9 pro x ∈ 3, 4), 1 pro x ∈ 4, ∞). Graf distribuční funkce je na obrázku 4.1. Vidíme, že distribuční funkce je schodovitá. 1 2 3 4 x y 1 y = F(x) Obr. 4.1: K příkladu 4.1: Distribuční funkce náhodné veličiny X První schůdek je v bodě x1 = 1 a jeho výška je p(1) = 0,4. Další schůdek je v bodě x2 = 2 a jeho výška je p(2) = 0,3. A tak dále, až poslední schůdek je v xn = x4 = 4 a jeho výška je p(4) = 0,1. Nalevo od prvního schůdku (tedy pro x → −∞) F(x) nabývá hodnoty 0 a napravo od posledního schůdku (tedy pro x → ∞) F(x) nabývá hodnoty 1. Body na začátku schůdku jsou vyznačeny plným kolečkem a konci schůdku prázdným kolečkem, tedy tak, že funkce F(x) je zprava spojitá. Zkuste si tento příklad spočítat s jednou malou úpravou. Zuzanka bude kuličky do pytlíku vracet. Můžete se inspirovat následujícím příkladem. Příklad 4.2. Pravděpodobnost, že student Martin přijde včas na vyučování, je 1 4 . Tato pravděpodobnost je stejná každý den, není závislá na předchozích dnech. Náhodná veličina X udává počet dnů, po kterých dojde k prvnímu pozdnímu příchodu. Určete její rozdělení. Řešení. Zřejmě X ∈ {0, 1, 2, 3, ...., n, ...}, Martin může přijít hned první den pozdě (počet dnů do prvního pozdního příchodu je 0), nebo přijde pozdě druhý den (počet dnů do prvního pozdního příchodu je 1) a tak dále, tedy naše náhodná proměnná může nabýt nekonečně mnoho hodnot. Určeme pravděpodobnosti jednotlivých jevů. 46 Diskrétní náhodná veličina • 0 dnů do prvního pozdního příchodu Jev, že student přijde pozdě, je opačný k jevu, že přijde včas, tedy jeho pravděpodobnost je 1 − 1 4 = 3 4 . Proto pravděpodobnost, že Martin přijde už první den pozdě, je p(0) = 3 4 . • 1 den do prvního pozdního příchodu Jestliže má být jeden den do prvního pozdního příchodu, tak Martin přišel první den včas a druhý den pozdě. Proto pravděpodobnost tohoto jevu bude součin pravděpodobností včasného a pozdního příchodu, tedy p(1) = 1 4 · 3 4 . • 2 dny do prvního pozdního příchodu Martin přišel první dva dny včas, což může nastat s pravděpodobností 1 4 · 1 4 = 1 4 2 . Třetí den přišel pozdě. Proto p(2) = 1 4 2 · 3 4 . • 3 dny do prvního pozdního příchodu První tři dny přišel Martin včas, což nastane s pravděpodobností 1 4 · 1 4 · 1 4 = 1 4 3 . Čtvrtý den přišel pozdě a proto p(3) = 1 4 3 · 3 4 . . . . • n dnů do prvního pozdního příchodu Po předchozích úvahách už umíme naše výsledky zobecnit: p(n) = 1 4 n · 3 4 . Pro kontrolu ještě zjistíme součet hodnot pravděpodobnostní funkce, o kterém víme, že musí být 1. (Pozor, může se stát, že i při špatně určené pravděpodobnostní funkci tento součet vyjde 1, proto ani tato kontrola nemusí zaručit správné řešení!) Při výpočtu použijeme vztah pro součet nekonečné geometrické řady. 3 4 + 1 4 · 3 4 + 1 4 2 · 3 4 + ... + 1 4 n · 3 4 + ... = = 3 4 1 + 1 4 + 1 4 2 + ... + 1 4 n + ... = = 3 4 · 1 1 − 1 4 = 1. Příklad 4.3. Diskrétní náhodná veličina X udává počet opravených písemek za hodinu. Její distribuční funkce je dána takto: F(x) =    0 pro x ∈ (−∞, 8), 0,1 pro x ∈ 8, 9), 0,3 pro x ∈ 9, 10), 0,6 pro x ∈ 10, 11), 0,9 pro x ∈ 11, 12), 1 pro x ∈ 12, ∞). 4.1 Základní pojmy a řešené příklady 47 Zjistěte pravděpodobnost toho, že za hodinu bude opravených a) právě 10 písemek, b) nanejvýš 10 písemek, c) aspoň 10 písemek. Řešení. a) Pravděpodobnost toho, že bude za hodinu opravených právě 10 písemek zjistíme z distribuční funkce snadno. Už víme, že P(X = 10) = p(10) je výška schůdku v x = 10. A to je rozdíl hodnot, které nabývá funkce F(x) na intervalu 10, 11) a na intervalu 9, 10), tedy p(10) = 0,6 − 0,3 = 0,3. b) Pravděpodobnost toho, že bude za hodinu opravených nanejvýš 10 písemek se dá zapsat jako P(X ≤ 10), což je přesně F(10). Protože pro interval 10, 11) nabývá F(x) hodnoty 0,6, je F(10) = 0,6, což je odpověď na část b). Úlohu bychom mohli vyřešit i trochu jinak. Co znamená, že bude opraveno nanejvýš 10 písemek? Že jich bude opraveno 10 nebo 9 nebo 8 a tak dále až 0 (méně se už zřejmě nedá). Tedy hledaná pravděpodobnost bude součtem pravděpodobností p(10), p(9), p(8), . . . , p(0). Na základě řešení části a) víme, že tyto pravděpodobnosti jsou výšky schůdků distribuční funkce v bodech 10, 9, 8, . . . , 0. Z předpisu F(x) vidíme, že v bodech 0 až 7 nejsou schůdky (funkce tam je konstantní), tedy jejich výška je nulová, výška schůdku v bodě 8 je 0,1, v bodě 9 je 0,2 a v bodě 10 je 0,3. Proto naše hledaná pravděpodobnost bude součet 0+· · ·+0+0,1+0,2+0,3 = 0,6, což je samozřejmě stejný výsledek, který jsme dostali užitím vědomostí o distribuční funkci. c) Pravděpodobnost toho, že bude za hodinu opravených aspoň 10 písemek, je P(X ≥ 10). K výpočtu můžeme využít výsledky částí a) a b) – pozor, jev z části b) není doplňkový k jevu z části c)! Jedna z možností výpočtu je P(X ≥ 10) = P(X > 10) + P(X = 10) = 1 − P(X ≤ 10) + P(X = 10) = = 1 − F(10) + p(10) = 1 − 0,6 + 0,3 = 0,7. Výsledek můžeme zjistit i tak, že sečteme pravděpodobnosti p(10), p(11), p(12), atd. Opět budeme sečítat výšky schůdků v jednotlivých bodech. Proto naše hledaná pravděpodobnost bude součet 0,3 + 0,3 + 0,1 + 0 + 0 + 0 + · · · = 0,7. Odkud se vzaly nulové hodnoty? V bodě 10 je schůdek vysoký 0,3 a stejný schůdek je v bodě 11, v bodě 12 má schůdek výšku 0,1 a pak už funkce F(x) svou hodnotu nemění, je konstantní a má hodnotu 1. Proto výšky dalších schůdků jsou nulové. Příklad 4.4. Pravděpodobnost, že výrobek bude vyhovovat všem požadavkům normy, je 0,8. Popište rozdělení počtu nevyhovujících mezi 3 výrobky. Pokus o řešení-bohužel nesprávný: Pro tři výrobky mohou nastat právě tyto čtyři (neslučitelné) možnosti: ani jeden nevyhovující, jeden nevyhovující, dva nevyhovující nebo tři nevyhovující. Postupně si je rozebereme: • Ani jeden nevyhovující výrobek To znamená, že všechny tři výrobky budou vyhovovat všem požadavkům normy. Nezávadnost či závadnost nějakého výrobku nezávisí od nezávadnosti nebo závadnosti jiného výrobku, jsou to nezávislé jevy. Proto když máme například dva výrobky 48 Diskrétní náhodná veličina v1, v2, a víme, že P(v1 je vyhovující) = P(v2 je vyhovující) = 0, 8 , tak pravděpodobnost, že tyto dva výrobky jsou vyhovující oba, je P(v1 je vyhovující) · P(v2 je vyhovující) = 0, 8 · 0, 8. My máme tři vyhovující výrobky, proto pravděpodobnost naší první možnosti je P(v1 je vyhovující)·P(v2 je vyhovující)·P(v3 je vyhovující) = 0, 8·0, 8·0, 8 = 0, 512. • Jeden nevyhovující výrobek Jestliže máme tři výrobky a jeden je nevyhovující, zbylé dva musí být vyhovující. Když pravděpodobnost vyhovujícího výrobku je 0, 8, tak pravděpodobnost nevyhovujícího výrobku je 1 − 0, 8 = 0, 2. Stejnou úvahou jako v předchozí části zjistíme, že hledaná pravděpodobnost je součinem 0, 2 · 0, 8 · 0, 8 = 0, 128. • Dva nevyhovující výrobky Ze tří výrobků máme dva nevyhovující, tedy jeden je vyhovující. Proto naše pravděpodobnost je 0, 2 · 0, 2 · 0, 8 = 0, 032. • Tři nevyhovující výrobky To znamená, že všechny tři výrobky jsou nevyhovující, a podle předchozích úvah pro pravděpodobnost našeho jevu dostáváme 0, 2 · 0, 2 · 0, 2 = 0, 008. Kde se stala chyba? Nebo si někdo myslí, že jsme rozdělení našli správně? Naše čtyři možnosti jsou neslučitelné a žádná další možnost už nemůže nastat. Proto by součet uvedených pravděpodobností měl být 1, ale náš součet je 0, 512 + 0, 128 + 0, 032 + 0, 008 = 0, 68 < 1. Protože víme, že součet pravděpodobností všech možností je 1, mnohokrát při hledání rozdělení postupujeme tak, že vypočítáme pravděpodobnosti všech možností kromě té poslední, pak je sečteme (součet označme p1...n−1), a pravděpodobnost poslední možnosti vypočítame jako rozdíl 1 − p1...n−1. Naštěstí jsme pravděpodobnost poslední možnosti spočítali zvlášť, jinak bychom chybu neodhalili. Správné řešení: Rozdělení na čtyři možnosti, které jsme provedli v našem nesprávném řešení, je správné. Výpočty pravděpodobností první a poslední možnosti jsou také správné, chyby jsme udělali jenom při určení pravděpodobností u druhé a třetí možnosti. Všimněme si druhé možnosti, tedy jeden výrobek je nevyhovující a dva jsou vyhovující. Kde jsme udělali chybu? Podle zápisu našeho výpočtu 0, 2 · 0, 8 · 0, 8 = 0, 128, jsme uvažovali jenom tu možnost, že nevyhovující výrobek byl první a zbylé dva byly vyhovující. Ale on mohl 4.1 Základní pojmy a řešené příklady 49 být i druhý výrobek nevyhovující (k tomu první a třetí výrobek vyhovující), nebo třetí nevyhovující (a k tomu první dva vyhovující). Proto pravděpodobnost této možnosti je 0, 2 · 0, 8 · 0, 8 + 0, 8 · 0, 2 · 0, 8 + 0, 8 · 0, 8 · 0, 2 = 0, 384. Podobně ve třetí možnosti (dva nevyhovující a jeden vyhovující výrobek) musíme uvažovat, že vyhovující výrobek může být první, druhý, nebo třetí, a proto pravděpodobnost této možnosti je 0, 8 · 0, 2 · 0, 2 + 0, 2 · 0, 8 · 0, 2 + 0, 2 · 0, 2 · 0, 8 = 0, 096. Když si teď sečteme všechny pravděpodobnosti, tak konečně dostaneme 0, 512 + 0, 384 + 0, 096 + 0, 008 = 1. A teď se budeme věnovat důležitým číselným charakteristikám náhodních veličin: Střední hodnota Střední hodnota diskrétní náhodné veličiny X se vypočítá jako EX = n i=1 xi · p(xi) = x1 · p(x1) + x2 · p(x2) + · · · . Zhruba řečeno, střední hodnota náhodné proměnné udává, jaký asi bude průměr získaných hodnot náhodné proměnné při mnoha opakováních náhodného procesu. Určit střední hodnotu má velký význam při statistických analýzách různých náhodných procesů, třeba známý algoritmus třídění quicksort může počítat i velmi dlouho, ale střední hodnota času jeho běhu je nejlepší ze všech běžných třídících algoritmů. Praktický výpočet středních hodnot v situacích složených výběrů lze výrazně ulehčit pomocí následujících dvou tvrzení. Pro libovolné dvě náhodné proměnné X, Y platí E(X + Y ) = EX + EY. Pro libovolné dvě nezávislé náhodné proměnné X, Y platí E(X · Y ) = EX · EY. Pro spolehlivý popis náhodné veličiny potřebujeme znát nejenom střed, kolem kterého se jednotlivé hodnoty soustřeďují, ale také jak daleko se od tohoto středu rozptylují. Rozptyl je definován jako střední hodnota kvadrátů odchylek od střední hodnoty. Odchylku od střední hodnoty, která má rozměr stejný jako náhodná veličina, zachycuje směrodatná odchylka. 50 Diskrétní náhodná veličina Rozptyl Pro diskrétní náhodnou veličinu můžeme rozptyl definovat vztahem DX = n i=1 [xi − EX]2 p(xi) = n i=1 x2 i p(xi) − (EX)2 , kde xi jsou hodnoty, kterých může náhodná veličina X nabývat s pravděpodobnostmi p(xi), a EX je střední hodnota veličiny X. Příklad 4.5. Diskrétní náhodná veličina udává počet dnů, které student využije na přípravu na zkoušku. Hodnoty její pravděpodobnostní funkce jsou v následující tabulce: xi 0 1 2 3 4 5 6 p(xi) 0,4 0,35 0,15 0,05 0,03 0,01 0,01 a) Určete očekávaný počet dnů, který student využije na přípravu. b) Určete rozptyl dané náhodné veličiny. Řešení. a) Z teorie víme, že součet hodnot pravděpodobnostní funkce musí být 1. Proto je třeba nejdřív to zkontrolovat. Jelikož 0,4 + 0,35 + 0,15 + 0,05 + 0,03 + 0,01 + 0,01 = 1,00, víme, že pravděpodobnostní funkce je zadána korektně, a proto můžeme spočítat její střední hodnotu podle známého vzorce: EX = 0 · 0,4 + 1 · 0,35 + 2 · 0,15 + 3 · 0,05 + 4 · 0,03 + 5 · 0,01 + 6 · 0,01 = 1,03. Tedy očekávaný počet dnů, který student využije na přípravu, je 1,03. (Trochu málo, nebo ne?) b) Zřejmě DX = n i=1 x2 i p(xi) − (EX)2 , a (EX)2 = 1, 032 = 1, 0609. Dále n i=1 x2 i p(xi) = 02 · 0,4 + 12 · 0,35 + 22 · 0,15 + 32 · 0,05 + 42 · 0,03 + 52 · 0,01 + 62 · 0,01 = 2,49, proto hledaný rozptyl je DX = 2,49 − 1,0609 = 1,4291. 4.1 Základní pojmy a řešené příklady 51 Příklad 4.6. Diskrétní náhodná veličina udává počet dnů bezporuchového provozu měřicího přístroje. Hodnoty její pravděpodobnostní funkce jsou v následující tabulce, ale dvě hodnoty neznáme. xi 0 1 2 3 4 5 6 p(xi) * 0,35 0,15 * 0,03 0,01 0,01 Určete je, když víte, že očekávaný počet dnů bezporuchového provozu je 1,5. Řešení. Víme, že součet hodnot pravděpodobnostní funkce má být 1, proto p(0) + p(1) + p(2) + p(3) + p(4) + p(5) + p(6) = 1, z toho dostaneme p(0) + p(3) = 0, 45, tedy p(0) = 0, 45 − p(3) a po dosazení do vzorce na výpočet střední hodnoty, (EX = 1,5), máme 1,5 = 0 · (0,45 − p(3)) + 1 · 0,35 + 2 · 0,15 + 3 · p(3) + 4 · 0,03 + 5 · 0,01 + 6 · 0,01, 1,5 = 1 · 0,35 + 2 · 0,15 + 3 · p(3) + 4 · 0,03 + 5 · 0,01 + 6 · 0,01, 1,5 = 0,35 + 0,3 + 3 · p(3) + 0,12 + 0,05 + 0,06, 1,5 = 0,88 + 3 · p(3), p(3) . = 0,2067, p(0) . = 0,45 − 0,2067 . = 0,2433. Zkuste si tuto úlohu spočítat pro stejné tabulkové hodnoty s tím, že střední hodnota bude 2,5. Pokud budete správně počítat, dostanete pro p(0) zápornou hodnotu, což je nesmysl. Podobně nevhodný výsledek by bylo číslo větší než 1. Proto dřív než svůj výsledek podtrhnete, posuďte jeho smysluplnost! Pro další příklady na střední hodnotu se podívejme na hody kostkami. • Jaká je střední hodnota (průměr) čísel padlých na šestistěnné kostce? Jednoduchým výpočtem vyjde EK = 1 6 (1 + 2 + 3 + 4 + 5 + 6) = 21 6 = 3,5. • Jaká je střední hodnota součtu čísel padlých na dvou šestistěnných kostkách? S využitím předchozího výsledku E(K1 + K2) = EK1 + EK2 = 3,5 + 3,5 = 7. • Jaká je střední hodnota součinu čísel padlých na dvou šestistěnných kostkách? S využitím předchozího výsledku E(K1 · K2) = EK1 · EK2 = 3,5 · 3,5 = 12,25. Vraťme se nyní k našemu intuitivnímu pojetí pravděpodobnosti jako očekávání četnosti opakování jevu. Pokud například hodíme n-krát mincí, pak pravděpodobnost 1 2 jedné strany mince znamená, že zhruba n/2-krát padne každá ze stran mince. Pokud je naše matematická formalizace pravděpodobnosti správná, měla by nám tentýž výsledek říci střední hodnota počtu hlav při n hodech mincí. Jak tomu skutečně je, ukazuje následující příklad. 52 Diskrétní náhodná veličina Příklad 4.7. Jaký je průměrný počet hlav padlých při n hodech mincí? Řešení. Pokud hlavě mince přiřadíme hodnotu 1, máme tak n náhodných proměnných Xi ∈ {0, 1}, i = 1, . . . , n příslušejících jednotlivým hodům mince. Celkový počet hlav je dán náhodnou proměnnou X = X1 + · · · + Xn. Takže průměrný počet hlav je EX = E(X1 + · · · + Xn) = EX1 + · · · + EXn = 1 2 + · · · + 1 2 = n 2 . To přesně odpovídá našemu vnímání pravděpodobnosti jako relativní četnosti jevu. Příklad 4.8. Kolik je třeba průměrně hodů mincí, aby vyšly tři stejné výsledky? Řešení. Je snadno vidět, že nejdříve tři stejné výsledky mohou nastat po třech hodech a nejpozději po pěti hodech (z dvou hlav a dvou orlů pět hodů nesložíme). S jakou pravděpodobností získáme stejné výsledky při třech hodech? Jsou možnosti buď tří hlav, nebo tří orlů, takže p(3) = 2 · 1 8 = 1 4 . Až po pěti hodech získáme 3 stejné výsledky, pokud první čtyři hody budou rozděleny dva na dva (na posledním hodu pak již vlastně nezáleží). To se může stát v 4 2 = 6 možnostech pro 4 hody, takže pravděpodobnost je p(5) = 6 · 1 16 = 3 8 . Možonst, že 3 stejné výsledky získáme po čtyřech hodech, je doplňková k předchozím dvěma a v součtu musí mít pravděpodobnost 1, proto p(4) = 1 − p(3) − p(5) = 1 − 1 4 − 3 8 = 3 8 . Průměrný počet potřebných hodů je dle definice střední hodnoty N = p(3) · 3 + p(4) · 4 + p(5) · 5 = 3 4 + 3 2 + 15 8 = 33 8 = 4,125. (To je o trochu více než 4, což by jeden mohl intuitivně očekávat.) Příklad 4.9. (varovný) Jaký je průměrný součin čísel horní a spodní stěny stejné kostky při hodech? Řešení. Jak už víme, střední hodnota čísla na horní stěně je 3,5 a dolní stěně samozřejmě taky 3,5. Střední hodnota jejich součinu však není 3,5 · 3,5 = 12,25, protože tyto dva jevy nejsou nezávislé. Místo toho střední hodnotu součinu spočítáme podle definice 1 6 (1 · 6 + 2 · 5 + 3 · 4 + 4 · 3 + 5 · 2 + 6 · 1) = 1 6 · 56 = 9 + 1 3 . Proto si dávejme dobrý pozor na nezávislost jevů při násobení středních hodnot! 4.2 Příklady pro samostatnou práci 53 4.2 Příklady pro samostatnou práci Příklad 4.10. Diskrétní náhodná veličina X udává počet gramatických chyb v textu. Její distribuční funkce F(x) je následovná: F(x) =    0 pro x ∈ (−∞, 0), 0,5 pro x ∈ 0, 1), 0,8 pro x ∈ 1, 2), 0,9 pro x ∈ 2, 3), 0,95 pro x ∈ 3, 4), 1 pro x ∈ 4, ∞). a) Určete střední hodnotu náhodné veličiny X. b) Určete pravděpodobnost toho, že v textu budou právě 3 chyby. c) Určete pravděpodobnost toho, že v textu budou méně než 2 chyby. Výsledek: a) EX = 0,85, b) P(X = 3) = 0,05, c) P(X < 2) = 0,8 Příklad 4.11. Diskrétní náhodná veličina X udává počet svetrů, které uplete studentka Petra za zimní semestr. Její distribuční funkce F(x) je následovná: F(x) =    0 pro x ∈ (−∞, 0), 0,05 pro x ∈ 0, 1), 0,15 pro x ∈ 1, 2), 0,65 pro x ∈ 2, 3), 0,85 pro x ∈ 3, 4), 1 pro x ∈ 4, ∞). a) Určete její střední hodnotu. b) Určete pravděpodobnost toho, že za semestr Petra uplete právě 2 svetry. c) Určete pravděpodobnost toho, že za semestr Petra uplete méně než 1 svetr. Výsledek: a) EX = 2,3, b) P(X = 2) = 0,5, c) P(X < 1) = 0,05 Příklad 4.12. Diskrétní náhodná veličina X udává počet pozdních příchodů studenta Martina H. na vyučování za semestr. Její distribuční funkce F(x) je následovná: F(x) =    0 pro x ∈ −∞, 1), 0,5 pro x ∈ 1, 2), 0,7 pro x ∈ 2, 3), 0,8 pro x ∈ 3, 4), 0,9 pro x ∈ 4, 5), 1 pro x ∈ 5, ∞). 54 Diskrétní náhodná veličina a) Určete její střední hodnotu. b) Určete pravděpodobnost toho, že za semestr bude mít Martin právě 4 pozdní příchody. c) Určete pravděpodobnost toho, že za semestr bude mít více než 3 pozdní příchody. Výsledek: a) EX = 2,1, b) P(X = 4) = 0,1, c) P(X > 3) = 0,2 Příklad 4.13. Je známa distribuční funkce denního počtu obsazených pokojů v hotelu: F(x) =    0 pro x ∈ (−∞, 7), 0,5 pro x ∈ 7, 8), 0,8 pro x ∈ 8, 9), 0,9 pro x ∈ 9, 10), 1 pro x ∈ 10, ∞). a) Určete pravděpodobnost, že v náhodně zvolený den bude obsazených právě 9 pokojů. b) Určete pravděpodobnost, že v náhodně zvolený den bude obsazených alespoň 8 pokojů. Výsledek: a) P(X = 9) = 0,1, b) P(X ≥ 8) = 0,5 Příklad 4.14. Pravděpodobnostní funkce náhodné proměnné X je daná tabulkou xi 10 11 12 13 14 15 16 p(xi) 0,45 0,3 0,1 0,05 0,08 0,01 0,01 Určete její střední hodnotu. Výsledek: EX = 11,08 Příklad 4.15. Náhodná proměnná X je daná tabulkou xi -1 0 1 2 3 4 5 p(xi) 0,04 0,35 0,15 0,05 0,03 0,01 0,01 Určete její střední hodnotu a rozptyl. Výsledek: Součet pravděpodobností není 1, úloha nemá smysl. Příklad 4.16. Diskrétní náhodná veličina X udává počet padnutých ok na šestistěnné kostce. a) Určete její pravděpodobnostní a distribuční funkci. b) Určete její střední hodnotu. c) Určete pravděpodobnost toho, že počet ok bude větší než 3. Výsledek: a) P(X = i) = 1 6 ; i ∈ {1, 2, 3, 4, 5, 6}, F(x) =    0 pro x ∈ (−∞, 1), i 6 pro x ∈ i, i + 1) , i ∈ {1, 2, ...5}, 1 pro x ∈ 6, ∞). b) EX = 3,5, c) P(X > 3) = 0,5 4.2 Příklady pro samostatnou práci 55 Příklad 4.17. Diskrétní náhodná veličina X udává součet padnutých ok na dvou šestistěnných kostkách. a) Určete její pravděpodobnostní funkci. b) Určete její střední hodnotu. c) Určete pravděpodobnost toho, že součet bude menší než 5. Výsledek: a) P(X = 2) = P(X = 12) = 1 36 , P(X = 3) = P(X = 11) = 1 18 , P(X = 4) = P(X = = 10) = 1 12 , P(X = 5) = P(X = 9) = 1 9 , P(X = 6) = P(X = 8) = 5 36 , P(X = 7) = 1 6 , b) EX = 7, c) P(X < 5) = 1 6 Příklad 4.18. Náhodná veličina X udává absolutní hodnotu rozdílu čísel padlých na dvou kostkách. a) Určete pravděpodobnostní rozdělení náhodné veličiny X. b) Určete střední hodnotu EX. Výsledek: a) p(i) =    1 6 pro i = 0, i = 3, 5 18 pro i = 1, 2 9 pro i = 2, 1 9 pro i = 4, 1 18 pro i = 5. b) EX = 35 18 Příklad 4.19. Vytáčení telefonického připojení k internetu je maximálně šestkrát opakováno (tj. po úspěšném připojení, respektive po šesti neúspěšných vytáčeních se v pokusu o spojení nepokračuje). Jednotlivá vytáčení jsou navzájem nezávislá. Pravděpodobnost správného připojení při každém vytáčení je rovna 0,6. Veličina X udává počet vytáčení při daném pokusu o spojení. a) Určete rozdělení pravděpodobnosti veličiny X. b) Určete střední hodnotu veličiny X. Výsledek: a) p(i) = 0,4i−1 · 0,6 pro i ∈ {1, ..., 5}, 0,45 · 0,6 + 0,46 pro i = 6, b) EX = 1,65984 Příklad 4.20. Balík je linkou nedostatečně zabalen s pstí 0,3. Jednotlivá balení jsou nezávislá na předchozích baleních. Balicí linka se zastaví poté, co balík je nedostatečně zabalen, v každém případě se však zastaví po zabalení pátého balíku. (X = počet zabalených balíků (ať už dobře, nebo špatně – počítají se všechny) před prvním zastavením linky). a) Určete pravděpodobnostní funkci veličiny X. b) Určete EX, DX. Výsledek: 56 Diskrétní náhodná veličina a) p(i) =    0,3 pro i = 1, 0,21 pro i = 2, 0,147 pro i = 3, 0,1029 pro i = 4, 0,2401 pro i = 5, b) EX = 2,7731, DX . = 2,4218 Příklad 4.21. Honza chodí na pravidelné odběry krve. Pravděpodobnost, že výsledek odběru bude dobrý, je vždy 0,4 a nezávisí na předchozích odběrech. Jestliže budou dva po sobě jdoucí odběry dobré, nebude muset přijít na další odběry. Dále také v každém případě přestane chodit na odběry po čtyřech absolvovaných odběrech. Náhodná veličina X udává počet odběrů, které Honza absolvuje v daném období. a) Určete pravděpodobnostní rozdělení náhodné veličiny X. b) Určete střední hodnotu EX. Výsledek: a) p(i) =    0,16 pro i = 2, 0,096 pro i = 3, 0,744 pro i = 4, b) EX = 3,584 Příklad 4.22. Honza má v zásobníku pět nábojů. Pravděpodobnost, že zasáhne terč, je vždy 0, 4 a nezávisí na předchozích pokusech. Honza bude střílet tak dlouho, dokud nezasáhne terč, pak střílet přestane. V každém případě přestane střílet, až mu dojde daných pět nábojů. Náhodná veličina X udává počet zbylých nábojů po vykonání popsaného experimentu. a) Určete pravděpodobnostní rozdělení náhodné veličiny X. b) Určete střední hodnotu EX. Výsledek: a) p(i) =    0,4 pro i = 4, 0,24 pro i = 3, 0,144 pro i = 2, 0,0864 pro i = 1, 0,1296 pro i = 0, b) EX = 2,6944 Příklad 4.23. Střelec střílí do terče, v zásobě má 4 náboje. Pravděpodobnost zásahu je při každém výstřelu 0,6. Diskrétní náhodná veličina X udává počet zásahů do terče. a) Určete její pravděpodobnostní funkci. b) Určete její střední hodnotu. Výsledek: 4.2 Příklady pro samostatnou práci 57 a) p(i) =    0,0256 pro i = 0, 0,1536 pro i = 1, 0,3456 pro i = 2, 0,3456 pro i = 3, 0,1296 pro i = 4, b) EX = 2,4 Příklad 4.24. Basketbalista hází trestné koše – s házením přestává po dvou úspěšných pokusech v těsném sledu za sebou, v každém případě ovšem přestává házet i po pátém pokusu. Pravděpodobnost úspěchu při každém hodu je 0,8. Jednotlivé hody jsou považovány za nezávislé. Veličina X udává počet hodů. a) Určete pravděpodobnostní funkci veličiny X. b) střední hodnotu veličiny X. Výsledek: a) p(i) =    0,64 pro i = 2, 0,128 pro i = 3, 0,128 pro i = 4, 0,104 pro i = 5, b) EX = 2,696 Příklad 4.25. Hráči A, B hrají následující hru: Losují za regulérních pravidel losy s čísly 1 až 20 (vytažení libovolného čísla je stejně pravděpodobné). Pokud je vytaženo některé z čísel 1 až 4, dává hráč A hráči B 40 Kč (zisk hráče A je záporný). Pokud je taženo některé z čísel 5 až 12, dává hráč A hráči B 60 Kč (zisk hráče A je záporný). Pokud je taženo číslo 13 nebo 14, dává hráč B hráči A k Kč. Pokud je taženo číslo 15 až 20, dává hráč B hráči A 30 Kč. a) Určete rozdělení veličiny X = zisk hráče A v jednom kole hry. Hodnotu k přitom zatím určovat nemusíte. b) Určete hodnotu k tak, aby se jednalo o spravedlivou hru, tj. střední hodnota zisku hráče A byla rovna nule. Výsledek: a) p(i) =    1 5 pro i = −40, 2 5 pro i = −60, 1 10 pro i = k, 3 10 pro i = 30, b) k = 230 Příklad 4.26. Budeme házet mincí, dokud nepadne znak. Diskrétní náhodná proměnná X udává počet hodů do prvního padnutí znaku. Určete pravděpodobnostní a distribuční funkci proměnné X. Výsledek: p(i) = 1 2i , i ∈ N, F(x) = 0 pro x < 1, 2n−1 2n pro x ∈ n, n + 1), 58 Diskrétní náhodná veličina Příklad 4.27. Diskrétní náhodná veličina X udává počet ok při hodu kostkou. Vypočítejte její rozptyl. Výsledek: 35/12 . = 2,917 Příklad 4.28. Jaká je střední hodnota počtu šestek padlých při hodu 10 šestistěnných kostek? Výsledek: 5/3 . = 1,667 Příklad 4.29. Jaký je průměrný počet hlav padlých při pěti hodech mincí? Výsledek: 2,5 Příklad 4.30. Jaký je průměrný počet hlav padlých při n hodech mincí? Výsledek: n 2 Příklad 4.31. Kolik je třeba průměrně hodů mincí, aby vyšly dva stejné výsledky? Výsledek: 2,5 Příklad 4.32. (varovný) Jaký je průměrný součet čísel horní a spodní stěny stejné kostky při hodech? Výsledek: 7 Příklad 4.33. * Kolik je třeba průměrně hodů mincí, aby padla první hlava? Návod: Uvědomte si, že teoreticky hlava nemusí padnout nikdy, ale pravděpodobnost samých orlů jde k nule. Výsledek: 2 59 5 Spojité náhodné veličiny 5.1 Základní pojmy a řešené příklady V předchozí kapitole jsme se věnovali diskrétním náhodným veličinám, které mohou nabývat pouze konečného počtu hodnot, nebo je počet možných hodnot sice nekonečný, ale lze je uspořádat do posloupnosti, jednotlivě si je ukazovat. Spojité náhodné veličiny jsou jiného charakteru. Zjednodušeně řečeno, mohou nabývat všech hodnot z určitého intervalu. Hustota pravděpodobnosti U spojité náhodné veličiny se pravděpodobnost, že náhodná veličina X padne do určitého intervalu (a, b), počítá jako P(X ∈ (a, b)) = b a f(x)dx, kde funkce f je tzv. hustota pravděpodobnosti náhodné veličiny X. Příklad 5.1. Hustota pravděpodobnosti náhodné veličiny X má tvar: f(x) =    0 pro x ≤ 1, x − 1 2 pro 1 < x ≤ 2, 0 pro x > 2. Vypočtěte pravděpodobnosti P(1,5 ≤ X ≤ 1,8), P(X < 1,2), P(X > 1,7), P(X = 1,5), P(X < 3). Dále najděte hodnotu a, pro kterou by platilo P(X < a) = 0,8. Řešení. První tři pravděpodobnosti vypočítáme jako integrál z hustoty f přes příslušný interval. Integrály z nulové funkce bychom mohli rovnou vynechávat, ale zde, v našem prvním příkladu, je vypíšeme. P(1,5 ≤ X ≤ 1,8) = 1,8 1,5 f(x) dx = 1,8 1,5 x − 1 2 dx = x2 2 − 1 2 x 1,8 1,5 = = 1,82 2 − 1 2 1,8 − 1,52 2 − 1 2 1,5 = 0,345, 60 Spojité náhodné veličiny P(X < 1,2) = 1,2 −∞ f(x) dx = 1 −∞ 0 dx + 1,2 1 x − 1 2 dx = x2 2 − 1 2 x 1,2 1 = 0,12, P(X > 1,7) = ∞ 1,7 f(x) dx = 2 1,7 x − 1 2 dx + ∞ 2 0 dx = x2 2 − 1 2 x 2 1,7 = 0,405. Pokud jde o P(X = 1,5), zde můžeme rovnou říct, že výsledek je nula, ale mohli bychom použít i integrál: P(X = 1,5) = 1,5 1,5 f(x) dx = 0. Poslední pravděpodobnost, P(X < 3), můžeme též určit bez jakéhokoli počítání. Výsledek musí být 1, protože náhodná veličina X menší než 3 určitě je. Pomocí integrálu bychom k výsledku došli takto: P(X < 3) = 3 −∞ f(x) dx = 1 −∞ 0 dx + 2 1 x − 1 2 dx + 3 2 0 dx = = x2 2 − 1 2 x 2 1 = 1. Nakonec určíme konstantu a, pro kterou je P(X < a) = 0,8 – hledáme vlastně 0,8-kvantil náhodné veličiny X. Je zřejmé, že a ∈ (1, 2). Musí platit P(X < a) = a 1 x − 1 2 dx = 0,8. Odtud dostáváme x2 2 − 1 2 x a 1 = 0,8 ⇒ a2 2 − 1 2 a − 12 2 − 1 2 · 1 = 0,8 ⇒ a2 − a − 1,6 = 0. Řešením této kvadratické rovnice s neznámou a dostáváme a1,2 = 1 ± √ 1 + 4 · 1,6 2 = 1 ± √ 7,4 2 . Protože kořen 1− √ 7,4 2 nenáleží do intervalu (1, 2), zůstává nám jediná možnost, a to a = 1 + √ 7,4 2 . = 1,86. Příklad 5.2. Teplota ve skleníku je náhodná veličina X s „lichoběžníkovým rozdělením pravděpodobnosti, graf její hustoty je na obrázku 5.1. a) Určete hodnotu h vyznačenou v obrázku. b) Vypočtěte pravděpodobnost, že teplota překročí 31,5◦ C. c) Pod jakou mez se teplota dostane jen s pravděpodobností 0,05? 5.1 Základní pojmy a řešené příklady 61 27 28 29 30 31 32 33 x y h y = f(x) Obr. 5.1: K příkladu 5.2: Hustota zadané náhodné veličiny X Řešení. a) Pro určení zatím neznámé hodnoty h (výšky lichoběžníka) využijeme faktu, že P(X ∈ (−∞, ∞)) = ∞ −∞ f(x)dx = 1. To znamená, že obsah celého lichoběžníka musí být roven 1. Pro výpočet obsahu lichoběžníka platí vztah S = h 2 (a + c), kde h je výška a a, c jsou délky základen. V našem případě je a = 6, c = 4, S má být rovno jedné, a tedy 1 = h 2 (6 + 4) ⇒ h = 2 10 = 1 5 = 0,2. b) Máme za úkol vypočítat P(X > 31,5). Tato pravděpodobnost je dána integrálem ∞ 31,5 f(x)dx neboli obsahem oblasti vyznačené na obrázku 5.2. 27 31,5 33 x y h y = f(x) Obr. 5.2: K příkladu 5.2, část b) Můžeme postupovat dvěma způsoby: buď vypočteme přímo obsah oblasti, nebo najdeme funkční předpis pro hustotu, a tu pak zintegrujeme. Předvedeme obě možnosti. Nejprve pomocí přímého výpočtu obsahu: Oblast se skládá z obdélníka a trojúhelníka. Výška je v obou případech h = 0,2, šířka obdélníka je 0,5 a základna trojúhelníka má délku 1. Celkem tedy P(X > 31,5) = 0,5 · 0,2 + 1 2 · 1 · 0,2 = 0,2. (Tento výsledek jsme mohli určit i „od oka , bez znalosti hodnoty h. Stačí si uvědomit, že vybarvená část tvoří jednu pětinu celkové plochy a že obsah celého lichoběžníka je 1.) Nyní vyřešíme stejný problém pomocí integrálu z hustoty: Nejprve musíme najít funkční předpis pro hustotu. Z obrázku vidíme, že graf hustoty se skládá z několika částí. Vně intervalu 27, 33 je f(x) = 0, na intervalu 28, 32 je hustota konstantní, f(x) = 0,2. Na intervalu 27, 28) je grafem hustoty část přímky se směrnicí k = 0,2 (připomeňme, že směrnice přímky je tangens úhlu, který přímka svírá s kladným směrem osy x, a že tangens se vypočítá jako poměr protilehlé a přilehlé odvěsny pravoúhlého trojúhelníka). 62 Spojité náhodné veličiny To znamená, že funkční předpis na tomto intervalu bude ve tvaru y = 0,2x + q. Přímka prochází bodem [27, 0], a proto 0 = 0,2 · 27 + q ⇒ q = −0,2 · 27 ⇒ y = 0,2(x − 27). Podobným způsobem bychom zjistili, že pro interval (32, 33 je f(x) = −0,2(x − 33). Celkem tedy máme f(x) =    0 pro x < 27, 0,2(x − 27) pro 27 ≤ x < 28, 0,2 pro 28 ≤ x ≤ 32, −0,2(x − 33) pro 32 < x ≤ 33, 0 pro x > 33 Požadovanou pravděpodobnost teď vypočteme příslušným integrálem: P(X > 31,5) = 32 31,5 0,2dx − 0,2 33 32 (x − 33)dx = 0,2 [x]32 31,5 − 0,2 (x − 33)2 2 33 32 = 0,2. c) Potřebujeme najít mezní hodnotu teploty, označme ji T, pro kterou by platilo P(X < T) = 0,05. To znamená, že hledáme T, pro které by obsah oblasti vyznačené na obrázku 5.3 byl roven 0,05. 27 T 33 x y h y = f(x) Obr. 5.3: K příkladu 5.2, část c) Je evidentní, že T bude někde mezi 27 a 28 (protože P(X < 28) = 0,1, což už je víc než 0,05). Pro výpočet T použijeme hustotu náhodné veličiny X, ale kdo chce, může zkusit najít T pouze pomocí obsahu vyznačeného trojúhelníka. P(X < T) = T 27 0,2(x − 27)dx = 0,2 (x − 27)2 2 T 27 = 0,1(T − 27)2 0,1(T − 27)2 = 0,05 ⇒ (T − 27)2 = 0,5 ⇒ T − 27 = ± 0,5 Protože T je určitě větší než 27, přichází v úvahu pouze + √ 0,5. Mezní hodnota, pod kterou teplota klesne jen s pravděpodobností 0,05, je proto T = 27 + √ 0,5 . = 27,7. 5.1 Základní pojmy a řešené příklady 63 Distribuční funkce a její vztah s hustotou Univerzální definice distribuční funkce náhodné veličiny X je F(x) = P(X ≤ x). U spojité náhodné veličiny se hodnoty distribuční funkce počítají jako F(x) = P(X ∈ (−∞, x ) = x −∞ f(t)dt. Hustota f se proto z distribuční funkce F spočítá jako f(x) = F (x). V bodech, kde F (x) není definována, můžeme f(x) zvolit libovolně. Příklad 5.3. Hustota pravděpodobnosti náhodné veličiny X má tvar: f(x) =    0 pro x ≤ 0, sin x pro 0 < x ≤ π 2 , 0 pro x > π 2 . a) Vypočtěte P(X ≤ −1), P(X ≤ π 4 ), P(X ≤ π 3 ) a P(X ≤ 2). b) Určete předpis pro distribuční funkci náhodné veličiny X. Řešení. Hledání distribuční funkce studentům často působí problémy. Proto zde budeme postupovat pomalu a opatrně. Všem, kdo by distribuční funkci uměli najít hned, bez zbytečného zdržování, se omlouváme. a) Budeme postupovat obdobně jako v příkladu 5.1. Zdá se, že tato část příkladu nepřináší nic nového, je však míněna jako příprava na část b). V rámci této přípravy teď jako integrační proměnnou místo x použijeme t: P(X ≤ −1) = −1 −∞ f(t)dt = −1 −∞ 0dt = 0 P(X ≤ π 4 ) = π/4 −∞ f(t)dt = π/4 0 sin tdt = [− cos t]π/4 0 = − √ 2 2 − (−1) . = 0,293 P(X ≤ π 3 ) = π/3 −∞ f(t)dt = π/3 0 sin tdt = [− cos t]π/3 0 = − 1 2 − (−1) = 0,5 P(X ≤ 2) = 2 −∞ f(t)dt = π/2 0 sin tdt + 2 π/2 0dt = [− cos t]π/2 0 = −0 − (−1) = 1 64 Spojité náhodné veličiny b) Distribuční funkce je definována jako F(x) = P(X ≤ x). To znamená, že v části a) už jsme vypočítali hodnoty F(−1), F(π/4), F(π/3) a F(2). Zde máme najít obecný předpis pro F(x). Platí F(x) = x −∞ f(t)dt. To už zde sice bylo uvedeno ve vzorcích v rámečku, při pohledu na řešení části a) ale možná bude jasnější, co se tímto vzorcem myslí. Též už je asi jasné, že distribuční funkce bude vypadat jinak, je-li x (neboli horní mez integrálu) menší než 0, je-li v intervalu 0, π/2 a je-li větší než π/2. Proto výpočet rozdělíme na tři části: Pro x < 0: F(x) = x −∞ f(t)dt = x −∞ 0dt = 0. Pro x ∈ 0, π/2 (reprezentanty tohoto případu byly výpočty pro x = π/4 a x = π/3) : F(x) = x −∞ f(t)dt = 0 −∞ 0dt + x 0 sin tdt = [− cos t]x 0 = − cos x + 1 = 1 − cos x. Pro x > π/2: F(x) = x −∞ f(t)dt = 0 −∞ 0dt + π/2 0 sin tdt + x π/2 0dt = 1. Celkem jsme dostali předpis pro distribuční funkci F(x) =    0 pro x < 0, 1 − cos x pro 0 ≤ x ≤ π/2, 1 pro x > π/2. Kdybychom nyní do této funkce dosadili za x např. π/4, dostali bychom stejnou hodnotu jako v části a). Můžete si též všimnout, že funkce F je spojitá, její jednotlivé části na sebe navazují. Upozornění na častou chybu: V prostřední fázi výpočtu studenti občas napíšou: Pro x ∈ 0, π/2 je F(x) = π/2 0 sin xdx = · · · To však není správně. Právě uvedený integrál udává pravděpodobnost, že náhodná veličina X patří do intervalu 0, π/2 . To ale vůbec není to, co chceme spočítat. Při výpočtu F(x) počítáme pravděpodobnost, že náhodná veličina X je menší nebo rovná x, a v tomto případě víme, že tohle x – horní mez integrálu – je z intervalu 0, π/2 , jako tomu bylo například pro x = π/3. Jiná častá chyba: Některým studentům se vzorec F(x) = x −∞ f(t)dt patrně nelíbí a použít jej nechtějí. Místo toho si řeknou: „Když hustotu f dostanu jako F , tak je F integrál z hustoty a hotovo! A napíšou: F(x) = f(x)dx = sin xdx = − cos x. 5.1 Základní pojmy a řešené příklady 65 To je špatně, což ukážeme na jednoduchém příkladu. Vypočtěme pomocí takto získané distribuční funkce P(X ≤ π/3): P(X ≤ π/3) = F(π/3) = − cos(π/3) = −0,5 Pravděpodobnost nám vyšla záporně!! (Pokud někoho tento fakt nezarazil, nechť se vrátí k první kapitole o pravděpodobnosti.) Oprava této chyby – jiný způsob nalezení F(x): Právě popsaný způsob (nalezení distribuční funkce F pomocí neurčitého integrálu z hustoty f) se ve skutečnosti použít dá, musíme být ale opatrní. Před chvílí jsme totiž zapomněli na integrační konstantu, ono „+c na závěr. Máme F(x) = f(x)dx = sin xdx = − cos x + c. Konstantu c nyní určíme tak, aby hodnoty funkce F vycházely správně. Například víme, že F(π/2) musí být 1 (protože P(X < π/2) = 1). Odtud F(π/2) = 1 ⇒ − cos(π/2) + c = 1 ⇒ 0 + c = 1 ⇒ c = 1. Distribuční funkce pro x ∈ 0, π/2 je proto F(x) = − cos x + 1. Stejně dobře jsme mohli pro určení c využít faktu, že F(0) musí být 0 (pro tento konkrétní příklad; obecně to být pravda nemusí). Opět bychom dostali, že c = 1. Nyní předvedeme ještě jeden příklad na hledání distribuční funkce. Hustota tentokrát bude rozdělena na více částí. Příklad 5.4. Najděte distribuční funkci náhodné veličiny X z příkladu 5.2 (příklad se skleníkem). Řešení. Už jsme zjistili, že hustota zkoumané náhodné veličiny X je f(x) =    0 pro x < 27, 0,2(x − 27) pro 27 ≤ x < 28, 0,2 pro 28 ≤ x ≤ 32, −0,2(x − 33) pro 32 < x ≤ 33, 0 pro x > 33 Budeme hledat distribuční funkci pro jednotlivé intervaly: Pro x < 27 je zřejmě F(x) = 0. Pro x ∈ 27, 28) : F(x) = x 27 0,2(t − 27)dt = 0,2 (t − 27)2 2 x 27 = 0,1(x − 27)2 . 66 Spojité náhodné veličiny (Poznamenejme, že primitivní funkce se samozřejmě mohla vyjádřit i jako 0,2(t2 2 − 27t). Dosazení mezí by pak vedlo k „ošklivějšímu tvaru výsledku, do kterého by se pracněji dosazovaly konkrétní hodnoty x.) Pro x ∈ 28, 32 : F(x) = 28 27 0,2(t − 27)dt + x 28 0,2dt = 0,2 (t − 27)2 2 28 27 + 0,2 [t]x 28 = = 0,1 + 0,2(x − 28). Pro x ∈ 32, 33 : F(x) = 28 27 0,2(t − 27)dt + 32 28 0,2dt + x 32 (−0,2)(t − 33)dt = = 0,2 (t − 27)2 2 28 27 + 0,2 [t]32 28 − 0,2 (t − 33)2 2 x 32 = 0,1 + 0,2 · 4 − −0,2 (t − 33)2 2 x 32 = 0,9 − 0,1((x − 33)2 − 1) = 1 − 0,1(x − 33)2 . Pro x > 33 můžeme říci rovnou, že bude F(x) = 1. Kdo by však chtěl vidět výpočet rozepsaný, má příležitost: F(x) = 28 27 0,2(t − 27)dt + 32 28 0,2dt + 33 32 (−0,2)(t − 33)dt + x 33 0dt = = 0,2 (t − 27)2 2 28 27 + 0,2 [t]32 28 − 0,2 (t − 33)2 2 33 32 = = 0,1 + 0,2 · 4 − 0,1(0 − 1) = 1. Celkem jsme dostali pro distribuční funkci předpis F(x) =    0 pro x < 27, 0,1(x − 27)2 pro 27 ≤ x < 28, 0,1 + 0,2(x − 28) pro 28 ≤ x ≤ 32, 1 − 0,1(x − 33)2 pro 32 < x ≤ 33, 1 pro x > 33. Graf distribuční funkce vidíme na obrázku 5.4 Můžete se pokusit právě nalezenou distribuční funkci spočítat znovu, ale bez integrování, pomocí obrázku 5.1. Stačí si uvědomit, že při výpočtu F(x) neboli P(X ≤ x) počítáme vlastně obsah plochy pod grafem hustoty f od −∞ po příslušné x. Např. je-li x ∈ 28, 32 , bereme obsah levého trojúhelníka (což je 0,1) a přidáváme k němu obsah obdélníka s výškou 0,2 a šířkou x−28. Výsledek je pak F(x) = 0,1+0,2(x−28) – porovnejte s výsledkem získaným integrací. 5.1 Základní pojmy a řešené příklady 67 27 28 29 30 31 32 33 x y 1 y = F(x) Obr. 5.4: Distribuční funkce náhodné veličiny z příkladu 5.4 Příklad 5.5. Náhodná veličina X má distribuční funkci F(x) = 1 2 + 1 π arctg x a) Vypočtěte následující pravděpodobnosti: P(X < 1), P(X > 1,5), P(0,5 < X ≤ 1,5) a P(−0,5 ≤ X ≤ 1). b) Najděte hodnotu x, kterou náhodná veličina X překročí (směrem nahoru) jen s pravděpodobností 0,01. c) Najděte interval souměrný podle počátku, do kterého náhodná veličina X padne s pravděpodobností 0,9. d) Určete hustotu pravděpodobnosti náhodné veličiny X. Řešení. a) Ještě jednou připomeňme, že F(x) = P(X ≤ x). V zadání je ale nerovnost ostrá, X < 1. Protože však u spojitých náhodných veličin platí P(X = x) = x x f(t)dt = 0, nemusíme na to brát ohled. Proto P(X < 1) = P(X ≤ 1) − P(X = 1) = F(1) − 0 = 1 2 + 1 π arctg 1 = 1 2 + 1 π · π 4 . = 0,75. Pro výpočet P(X > 1,5) použijeme pravděpodobnost jevu opačného. Opačný jev k jevu [X > 1,5] je [X ≤ 1,5], a tedy P(X > 1,5) = 1 − P(X ≤ 1,5) = 1 − F(1,5) = 1 − 1 2 + 1 π arctg 1,5 . = 0,187. Má-li být 0,5 < X ≤ 1,5, znamená to, že X musí být menší nebo rovné 1,5, a přitom nesmí být menší nebo rovné 0,5. Proto P(0,5 < X ≤ 1,5) = P(X ≤ 1,5) − P(X ≤ 0,5) = F(1,5) − F(0,5) = 68 Spojité náhodné veličiny = 1 2 + 1 π arctg 1,5 − 1 2 + 1 π arctg 0,5 . = 0,165. Protože právě předvedená úvaha některým studentům činí potíže, vysvětlíme vše ještě pomocí obrázku 5.5. Na tomto obrázku je znázorněna hustota náhodné veličiny X (funkční předpis pro ni zatím neznáme, ale to teď nijak nevadí). Jak víme, pravděpodobnost, že 0,5 < X ≤ 1,5, je rovna obsahu plochy pod grafem hustoty na intervalu (0,5; 1,5 . Dále, hodnota distribuční funkce v bodě 0,5, tj. pravděpodobnost, že X ≤ 0,5, je rovna obsahu plochy pod grafem hustoty na intervalu (−∞; 0,5 . V našem obrázku je tato plocha vyznačena svislým šrafováním. Podobně, hodnota distribuční funkce v bodě 1,5 je rovna obsahu plochy, která je v obrázku 5.5 šedě vybarvena. Nás zajímá obsah plochy, která je šedá, ale nikoli šrafovaná. Opět se dostáváme k tomu, že od sebe musíme odečíst F(1,5) a F(0,5). 0,5 1,5 x y y = f(x) Obr. 5.5: K příkladu 5.5 – hustota náhodné veličiny X Ještě zbývá vypočítat P(−0,5 ≤ X ≤ 1). Protože pravděpodobnosti, že by se X rovnalo nějaké jedné konkrétní hodnotě, jsou nulové, můžeme tento příklad řešit stejně jako ten předchozí: P(−0,5 ≤ X ≤ 1) = F(1) − F(−0,5) = 1 2 + 1 π arctg 1 − 1 2 + 1 π arctg(−0,5) . = 0,398. b) Hledáme x, pro které by platilo P(X > x) = 0,01. Už jsme ukázali, že P(X > x) = = 1 − P(X ≤ x) = 1 − F(x). Proto musíme najít x, pro které bude 1 − F(x) = 0,01. Dosazením do funkce F dostáváme: 1 − 1 2 + 1 π arctg x = 0,01 ⇒ arctg x = π 1 2 − 0,01 Tedy x = tg (0,49π) . = 31,82. c) Hledáme interval, označme jej (−a, a), pro který by platilo P(−a < X < a) = 0,9. Při výpočtu využijeme faktu, že funkce arctg je lichá. P(−a < X < a) = F(a) − F(−a) = 1 2 + 1 π arctg a − 1 2 + 1 π arctg(−a) = = 1 π (arctg a − arctg(−a)) = 2 π arctg a 2 π arctg a = 0,9 ⇒ a = tg 0,9π 2 . = 6,31 5.1 Základní pojmy a řešené příklady 69 Hledaný interval je tedy (−6,31; 6,31). d) Platí, že f(x) = F (x), a tedy v našem případě f(x) = 1 2 + 1 π arctg x = 1 π · 1 1 + x2 . Kdo by chtěl, může teď části příkladu a), b), c) vyřešit pomocí hustoty. V předchozím příkladu jsme ukázali výpočty pravděpodobnosti různých typů nerovností. Vše shrneme do rámečku: Výpočty různých pravděpodobností pomocí distribuční funkce Pro jakoukoli náhodnou veličinu platí P(X ≤ x) = F(x) P(X > x) = 1 − F(x) P(a < X ≤ b) = F(b) − F(a). Protože pro spojité náhodné veličiny je P(X = x) = 0, můžeme pro spojité náhodné veličiny všude nahradit ostré nerovnosti neostrými a naopak. Střední hodnota, rozptyl a směrodatná odchylka Střední hodnota spojité náhodné veličiny X se vypočítá jako EX = ∞ −∞ x · f(x)dx, rozptyl jako DX = ∞ −∞ x2 · f(x)dx − (EX)2 a směrodatná odchylka je √ DX. Příklad 5.6. Hustota pravděpodobnosti náhodné veličiny X má tvar: f(x) =    0 pro x ≤ 0, 1 2 sin x pro 0 < x ≤ π, 0 pro x > π. a) Vypočtěte střední hodnotu, rozptyl a směrodatnou odchylku náhodné veličiny X. b) Vypočtěte pravděpodobnost, že náhodná veličina X překročí (směrem nahoru) svou střední hodnotu více než o π/4. c) Vypočtěte pravděpodobnost, že se náhodná veličina X bude od své střední hodnoty lišit nanejvýš o dvojnásobek směrodatné odchylky. 70 Spojité náhodné veličiny Řešení. a) Střední hodnota: EX = ∞ −∞ x · f(x)dx = 1 2 π 0 x sin xdx u = x u = 1 v = sin x v = − cos x = 1 2 [−x cos x]π 0 + π 0 cos xdx = 1 2 (π + [sin x]π 0 ) = π 2 . Tento výsledek jsme mohli i uhodnout, protože graf hustoty je souměrný podle přímky x = π/2, takže se dá čekat, že „průměrně bude náhodná veličina X nabývat hodnoty π/2. Rozptyl: DX = ∞ −∞ x2 · f(x)dx − (EX)2 = 1 2 π 0 x2 sin xdx − π 2 2 . Nejprve zvlášť vypočteme integrál z x2 sin x, a pak se vrátíme k výpočtu DX: π 0 x2 sin xdx = u = x2 u = 2x v = sin x v = − cos x = −x2 cos x π 0 + 2 π 0 x cos xdx = = u = x u = 1 v = cos x v = sin x = π2 + 2 [x sin x]π 0 − π 0 sin xdx = π2 − 4 Rozptyl je pak DX = 1 2 π2 − 4 − π 2 2 = π2 4 − 2 . = 0,467. Směrodatná odchylka: √ DX = π2 4 − 2 . = 0,684. Upozornění na častou chybu: Při výpočtu rozptylu často člověk správně zapíše začátek výpočtu: DX = ∞ −∞ x2 f(x)dx − (EX)2 , ale pak se soustředí na výpočet integrálu a na odečtení (EX)2 zapomene. Nevíme, jak této chybě zabránit. Snad jen doporučíme čtenáři, ať si poctivě počítá příklady. Jestliže se této chyby párkrát dopustí, dokud je to „nanečisto , při písemce se mu to snad už nestane. b) Budeme počítat pravděpodobnost, že X bude větší než EX + π/4: P(X > EX + π 4 ) = P(X > 3π 4 ) = 1 2 π 3π/4 sin xdx = 1 2 [− cos x]π 3π/4 = = − 1 2 −1 − − √ 2 2 = 2 − √ 2 4 . = 0,146. c) Vypočteme pravděpodobnost, že X bude v intervalu EX − 2 √ DX, EX + 2 √ DX : P(EX − 2 √ DX ≤ X ≤ EX + 2 √ DX) = P(π 2 − 2 π2 4 − 2 ≤ X ≤ π 2 + 2 π2 4 − 2) . = P(0,636 ≤ X ≤ 2,506) = 1 2 2,506 0,636 sin xdx . = 0,804. Na výpočet střední hodnoty a rozptylu předvedeme ještě jeden příklad, tentokrát s hustotou definovanou po částech. 5.1 Základní pojmy a řešené příklady 71 Příklad 5.7. Hustota pravděpodobnosti náhodné veličiny X má tvar: f(x) =    1 6 x pro x ∈ 0, 3 −1 2 (x − 4) pro x ∈ (3, 4 0 jinak. a) Vypočtěte střední hodnotu a rozptyl náhodné veličiny X. b) Vypočtěte P(X < EX), P(X > EX + 1) a P(X > 2EX). Řešení. a) Střední hodnota: EX = ∞ −∞ x · f(x)dx = 3 0 1 6 x2 dx + 4 3 −1 2 (x2 − 4x) dx = = 1 6 x3 3 3 0 − 1 2 x3 3 4 3 + 2 x2 2 4 3 = 27 18 − 1 6 (64 − 27) + 16 − 9 = 7 3 . = 2,333 Rozptyl: DX = ∞ −∞ x2 · f(x)dx − (EX)2 . Integrál z x2 f(x) vypočteme zvlášť pro jednotlivé intervaly a pak vše dáme dohromady: 3 0 1 6 x3 dx = 1 6 x4 4 3 0 = 1 24 (81 − 0) = 27 8 4 3 −1 2 (x3 − 4x2 ) dx = − 1 2 x4 4 4 3 + 2 x3 3 4 3 = −1 8 (256 − 81) + 2 3 (64 − 27) = 67 24 Celkem tedy ∞ −∞ x2 · f(x)dx = 27 8 + 67 24 = 148 24 = 37 6 , DX = 37 6 − 7 3 2 = 13 18 . = 0,722. b) Při výpočtu zadaných pravděpodobností musíme dbát na to, ve kterém intervalu se pohybujeme. Uvědomme si, že 10/3 . = 3,333 a 14/3 . = 4,667. P(X < EX) = P X < 7 3 = 7/3 0 1 6 xdx = 1 6 x2 2 7/3 0 = 1 12 · 7 3 2 = 49 108 . = 0,454 P(X > EX + 1) = P X > 10 3 = 4 10/3 −1 2 (x − 4) dx = −1 4 x2 4 10/3 + 2 [x]4 10/3 = = −1 4 (16 − 100 9 ) + 2 4 − 10 3 = 1 9 . = 0,111 P(X > 2EX) = P X > 14 3 = 0. 72 Spojité náhodné veličiny 5.2 Příklady pro samostatnou práci Příklad 5.8. Náhodná veličina X má hustotu f(x) = 1+3x2 2 pro x ∈ 0, 1 , 0 jinak. Vypočtěte pravděpodobnosti: a) P(X ∈ (1/2, 3/4)); b) P(X < 0,3); c) P(X > 4/5); d) P(X < 2); e) P(X > 3). Výsledek: a) 35/128 . = 0,273; b) 0,1635; c) 43/125 . = 0,344; d) 1; e) 0 Příklad 5.9. Náhodná veličina X má distribuční funkci F(x) =    0 pro x ≤ 3, 1 3 x − 1 pro 3 < x ≤ 6, 1 pro x > 6. Vypočtěte pravděpodobnosti: a) P(X < 4); b) P(X > 5,5); c) P(3,5 < X < 5); d) P(X > 2); e) P(X > 7). Výsledek: a) 1/3; b) 1/6; c) 1/2; d) 1; e) 0 Příklad 5.10. Hustota pravděpodobnosti náhodné veličiny X má tvar: f(x) =    0 pro x ≤ 1, x − 1 2 pro 1 < x ≤ 2, 0 pro x > 2. Najděte distribuční funkci náhodné veličiny X a pak pomocí ní vypočítejte tytéž pravděpodobnosti, jaké se počítaly v příkladu 5.1 (všimněte si, že jde o náhodnou veličinu se stejnou hustotou). Výsledek: F(x) = 0 pro x ≤ 1; F(x) = (x2 − x)/2 pro 1 < x ≤ 2; F(x) = 1 pro x > 2. Pravděpodobnosti viz příklad 5.1. Příklad 5.11. Je dána funkce f(x) = a − x2 pro x ∈ 0, 1 , 0 jinak. a) Určete konstantu a tak, aby funkce f(x) byla hustotou pravděpodobnosti nějaké náhodné veličiny. b) Určete střední hodnotu a rozptyl příslušné náhodné veličiny. Výsledek: a) a = 4/3 (najde se na základě podmínky ∞ −∞ f(x)dx = 1); b)EX = 5/12, DX = 17/240. 5.2 Příklady pro samostatnou práci 73 Příklad 5.12. Náhodná veličina X má distribuční funkci F(x) =    0 pro x ≤ 2, 1 4 (x − 2) pro 2 < x ≤ 6, 1 pro x > 6. a)Určete hustotu pravděpodobnosti náhodné veličiny X. b)Znázorněte graficky hustotu a distribuční funkci. c)Určete střední hodnotu, rozptyl a směrodatnou odchylku. Výsledek: a) f(x) = 1/4 pro 2 < x < 6; f(x) = 0 jinak; b) viz obrázek 5.6; c) EX = 4, DX = 4/3, √ DX = 2 √ 3/3 . = 1,155 x x2 26 6 y y 1 1 1/4 y = F(x) y = f(x) Obr. 5.6: K příkladu 5.12 – distribuční funkce a hustota náhodné veličiny X Příklad 5.13. Náhodná veličina X má distribuční funkci F(x) =    0 pro x ≤ 0, x2 pro 0 < x ≤ 1, 1 pro x > 1. a) Určete hodnotu a, kterou X překročí směrem dolů jen s pravděpodobností 0,25. b) Určete hodnotu b, kterou X překročí směrem nahoru jen s pravděpodobností 0,1. c) Určete střední hodnotu a rozptyl náhodné veličiny X. Výsledek: a) a = 0,5; b) b = 3 √ 10/10 . = 0,949; c) EX = 2/3, DX = 1/18 Příklad 5.14. Náhodná veličina X má distribuční funkci F(x) =    0 pro x ≤ 0, sin 2x pro 0 < x ≤ π 4 , 1 pro x > π 4 . a)Určete hustotu pravděpodobnosti náhodné veličiny X. b)Znázorněte graficky hustotu a distribuční funkci. c)Určete střední hodnotu a rozptyl. Výsledek: a) f(x) = 2 cos 2x pro 0 < x < π/4, f(x) = 0 jinak; b) viz obrázek 5.6; c) EX = −1/2 + π/4, DX = −3/4 + π/4 74 Spojité náhodné veličiny x xπ/4 π/4 y y 1 1 2 y = F(x) y = f(x) Obr. 5.7: K příkladu 5.14 – distribuční funkce a hustota náhodné veličiny X Příklad 5.15. Je dána funkce f(x) = a x pro x ∈ 1, e , 0 jinak. a) Určete konstantu a tak, aby funkce f(x) byla hustotou pravděpodobnosti. b) Určete předpis pro distribuční funkci příslušné náhodné veličiny. c) Určete střední hodnotu a rozptyl. Výsledek: a) a = 1; b) F(x) = 0 pro x < 1, F(x) = ln x pro 1 < x < e, F(x) = 1 pro x > e; c) EX = e − 1, DX = −e2 /2 + 2e − 3/2 . = 0,242 Příklad 5.16. Hustota pravděpodobnosti náhodné proměnné X má tvar f(x) = c cos x pro − π 2 < x ≤ π 2 , 0 jinak. a) Určete konstantu c. b) Určete předpis pro distribuční funkci F(x). c) Najděte interval souměrný kolem nuly, ve kterém náhodná veličina X bude ležet s pravděpodobností 0,95 Výsledek: a) c = 1/2; b) F(x) = 0 pro x < −π/2, F(x) = (1 + sin x)/2 pro −π/2 ≤ x < < π/2, F(x) = 1 pro x ≥ π/2; c) (− arcsin(19/20), arcsin(19/20)) . = (−1,253; 1,253) Příklad 5.17. Hustota pravděpodobnosti náhodné proměnné X má tvar f(x) = 6x(1 − x) pro 0 < x ≤ 1, 0 jinak. 5.2 Příklady pro samostatnou práci 75 a) Ověřte, že funkce f opravdu může být hustotou nějaké náhodné veličiny. b) Určete předpis pro distribuční funkci F(x). c) Určete střední hodnotu a rozptyl. d) Určete pravděpodobnost, že se náhodná veličina od své střední hodnoty liší více než o 1/3. Výsledek: a) ano, f je nezáporná funkce a ∞ −∞ f(x)dx = 1; b) F(x) = 0 pro x < 0, F(x) = −2x3 + 3x2 pro 0 ≤ x < 1, F(x) = 1 pro x ≥ 1; c) EX = 1/2, DX = 1/20; d) 4/27 . = 0,148 Příklad 5.18. Hustota pravděpodobnosti náhodné proměnné X má tvar f(x) = a(3x − 4) pro 1 < x ≤ 2, 0 jinak. a) Určete konstantu a a pak načrtněte graf funkce f. b) Určete předpis pro její distribuční funkci F(x). c) Určete P(0 < X < 1 2 ). d) Určete střední hodnotu a rozptyl. Výsledek: Příklad nemá řešení. Z podmínky ∞ ∞ f(x)dx = 1 by vyšlo a = 2, jenže funkce f nabývá na části intervalu 1, 2 záporných hodnot, což se u hustoty nesmí stát. Části b), c), d) proto nemá význam počítat. Příklad 5.19. Chyba určitého měření je náhodná veličina X s „trojúhelníkovým rozdělením pravděpodobnosti. Graf její hustoty je na obrázku 5.8. a) Určete hodnotu h. b) Najděte funkční předpis pro hustotu f. c) Najděte funkční předpis pro distribuční funkci F. d) Vypočtěte pravděpodobnost, že chyba bude v intervalu (−1, 1). e) Najděte interval souměrný kolem nuly, v němž bude chyba s pravděpodobností 0,99. −3 −2 −1 1 2 3 x y h y = f(x) Obr. 5.8: K příkladu 5.19 – hustota náhodné veličiny X Výsledek: a) h = 1/3; b) f(x) = (x + 3)/9 pro −3 < x < 0, f(x) = −(x − 3)/9 pro 0 ≤ x < 3, f(x) = 0 jinak; c) F(x) = 0 pro x < −3, F(x) = (x + 3)2 /18 pro −3 ≤ x < 0, F(x) = 1 − (x − 3)2 /18 pro 0 ≤ x < 3, F(x) = 1 pro x ≥ 3; d) 5/9; e) (−2,7; 2,7) 76 Spojité náhodné veličiny Příklad 5.20. Náhodná proměnná X má distribuční funkci: F(x) =    0 pro x ≤ 1, ln x pro 1 < x ≤ a, 1 pro x > a. a) Určete konstantu a. b) Určete hustotu pravděpodobnosti náhodné proměnné. c) Určete střední hodnotu a rozptyl. Výsledek: a) a = e, b) f(x) = 0 pro x ∈ (−∞, 1 ∪ (e, ∞), 1 x pro 1 < x ≤ e, c) EX = e − 1, DX = (e−1)(3−e) 2 Příklad 5.21. Náhodná proměnná X má distribuční funkci: F(x) =    0 pro x ≤ −2, 1 2 + 1 π arcsin x 2 pro −2 < x ≤ 2, 1 pro x > 2. a)Určete hustotu pravděpodobnosti náhodné proměnné. b)Pravděpodobnost toho, že náhodná proměnná nabýva hodnoty z intervalu (−1, 1). Výsledek: a) f(x) = 0 pro x ∈ (−∞, −2 ∪ (2, ∞) 1 π √ 4−x2 pro −2 < x ≤ 2, b) 1 3 . Příklad 5.22. Náhodná proměnná X má distribuční funkci: F(x) =    0 pro x ≤ 0, a + b sin x pro 0 < x ≤ π 2 , 1 pro x > π 2 . a) Určete konstanty a, b. b) Určete hustotu pravděpodobnosti náhodné proměnné. c) Určete P(0 < X < π 4 ). Výsledek: a) a = 0, b = 1, b) f(x) = 0 pro x ∈ (−∞, 0 ∪ π 2 , ∞ , cos x pro 0 < x ≤ π 2 , c) P(0 < X < π 4 ) = 1√ 2 . Příklad 5.23. Náhodná proměnná X má distribuční funkci: F(x) = a + b.e−x pro x > 0, 0 pro x ≤ 0, 5.2 Příklady pro samostatnou práci 77 a) Určete konstanty a, b. b) Určete hustotu pravděpodobnosti náhodné proměnné. c) Určete P(0 < X < 3). Výsledek: a) a = 1, b = −1, b) f(x) = 0 pro x ≤ 0, e−x pro x > 0, c) P(0 < X < 3) = 1− 1 e3 . Příklad 5.24. Náhodná proměnná X má distribuční funkci: F(x) = a + b 1+x2 pro x > 0, 0 pro x ≤ 0, a) Určete konstanty a, b. b) Určete hustotu pravděpodobnosti náhodné proměnné. Výsledek: a) a = 1, b = −1, b) f(x) = 2x (1+x2)2 , ∀x > 0. Příklad 5.25. Náhodná proměnná X má distribuční funkci: F(x) = a + b arctg ax a) Určete konstanty a, b. b) Určete hustotu pravděpodobnosti náhodné proměnné. Výsledek: a) a = 1 2 , b = 1 π , b) f(x) = 2 π(x2+4) ; ∀x ∈ R. Příklad 5.26. Hustota pravděpodobnosti náhodné proměnné X má tvar: f(x) =    0 pro x ≤ 1, a(x − 1) pro 1 < x ≤ 2, a(x − 2) pro 2 < x ≤ 3, 0 pro x > 3. a) Určete konstantu a. b) Určete předpis pro její distribuční funkci F(x). c) Určete P(1 < X < 3 2 ). Výsledek: a) a = 1, b) F(x) =    0 pro x ≤ 1, x2 2 − x + 1 2 pro 1 < x ≤ 2, x2 2 − 2x + 5 2 pro 2 < x ≤ 3, 1 pro x > 3, c) P(1 < X < 3 2 ) = 1 8 . 78 Spojité náhodné veličiny Příklad 5.27. Hustota pravděpodobnosti náhodné proměnné X má tvar: f(x) =    0 pro x ≤ −1, a(x + 1) pro −1 < x ≤ 0, a(1 − x) pro 0 < x ≤ 1, 0 pro x > 1. a) Určete konstantu a. b) Určete předpis pro její distribuční funkci F(x). c) Určete P(0 ≤ X < 1 2 ). Výsledek: a) a = 1, b) F(x) =    0 pro x ≤ −1, x2 2 + x + 1 2 pro −1 < x ≤ 0, x − x2 2 + 1 2 pro 0 < x ≤ 1, 1 pro x > 1, c) P(0 ≤ X < 1 2 ) = 3 8 . Příklad 5.28. Hustota pravděpodobnosti náhodné proměnné X má tvar: f(x) =    0 pro x ≤ 0, ax pro 0 < x ≤ 1, a pro 1 < x ≤ 2, a(3 − x) pro 2 < x ≤ 3, 0 pro x > 3. a) Určete konstantu a. b) Určete předpis pro její distribuční funkci F(x). c) Určete P(0 < X ≤ 1 2 ). Výsledek: a) a = 1 2 , b) F(x) =    0 pro x ≤ 0, x2 4 pro 0 < x ≤ 1, 1 2 x − 1 4 pro 1 < x ≤ 2, 3 2 x − x2 4 − 5 4 pro 2 < x ≤ 3, 1 pro x > 3. c) P(0 < X ≤ 1 2 ) = 1 16 . Příklad 5.29. Hustota pravděpodobnosti náhodné proměnné X má tvar: f(x) =    0 pro x ≤ 0, ax2 pro 0 < x ≤ 1, 1 x pro 1 < x ≤ e, 0 pro x > e. a) Určete konstantu a. b) Určete předpis pro její distribuční funkci F(x). 5.2 Příklady pro samostatnou práci 79 Výsledek: a) a = 0, b) F(x) =    0 pro x ≤ 1, ln x pro 1 < x ≤ e, 1 pro x > e. Příklad 5.30. Hustota pravděpodobnosti náhodné proměnné X má tvar: f(x) = a 1 + x2 . a) Určete konstantu a. b) Určete předpis pro její distribuční funkci F(x). c) Určete P(−1 < X < 1). Výsledek: a) a = 1 π , b) F(x) = 1 π arctg x + 1 2 ; ∀x ∈ R, c) P(−1 < X < 1) = 1 2 . Příklad 5.31. Hustota pravděpodobnosti náhodné proměnné X má tvar: f(x) = 4a ex + e−x . a) Určete konstantu a. b) Určete předpis pro její distribuční funkci F(x). Výsledek: a) a = 1 2π , b) F(x) = 2 π arctg ex ; ∀x ∈ R. 80 Významná diskrétní rozdělení pravděpodobnosti 6 Významná diskrétní rozdělení prav- děpodobnosti V této části probereme některá z nejznámějších diskrétních rozdělení pravděpodobností – binomické, geometrické a hypergeometrické. Podívejme se nejdřív na dva následující jednoduché příklady. Příklad 6.1. Jaká je pravděpodobnost události A, že při 5-násobném nezávislém opakování hodu pravidelnou kostkou padne šestka při druhém a čtvrtém hodu, zatímco při prvním, třetím a pátém ne? Řešení. Počet všech možností při pěti nezávislých hodech je 6 · 6 · 6 · 6 · 6 = 65 . Můžeme si je představit jako uspořádané pětice z čísel 1, 2, 3, 4, 5, 6. Událost A reprezentují pětice, které mají na druhém a čtvrtém místě šestku a na zbylých místech jsou čísla z množiny {1, 2, 3, 4, 5}. Počet takových pětic je 5 · 1 · 5 · 1 · 5 = 53 . Proto P(A) = 53 65 = 1 6 2 · 5 6 3 . Příklad 6.2. Jaká je pravděpodobnost události B, že při 5-násobném nezávislém opakování hodu pravidelnou kostkou padne šestka právě dvakrát? Řešení. Událost B reprezentují pětice, které mají na dvou místech šestku a na zbylých třech místech jsou čísla z množiny {1, 2, 3, 4, 5}. Šestky můžou padnout první dvě, nebo první a třetí, první a čtvrtá, a tak dále až poslední dvě, schematicky můžeme zapsat následovně: (66 − −−), (6 − 6 − −), (6 − −6−), (6 − − − 6), (−66 − −), . . . , (− − −66). Pravděpodobnost všech uvedených možností je stejná a její hodnotu jsme vypočítali v předchozím příkladu. Kolik je vlastně uvedených možností? Z pěti míst vybíráme vždy dvě místa pro šestky, což můžeme udělat 5 2 způsoby. Proto P(B) = 5 2 · 53 65 = 5 2 · 1 6 2 · 5 6 3 = 0,16. Není problém výsledek zobecnit. Nechť událost U může nastat s pravděpodobností p. Jaká je pravděpodobnost, že při n stejných a nezávislých pokusech se bude událost U 81 opakovat právě k-krát? Poučeni řešením předchozích příkladů už bez problémů umíme tuto pravděpodobnost určit. Stačí si jen uvědomit, že pravděpodobnost toho, že nenastane událost U, je 1 − p. Potom P(U nastane k-krát) = n k · pk · (1 − p)n−k . Tento výsledek je dost důležitý a má i svůj název - Bernoulliho schéma. My jej hned aplikujeme, budeme se totiž zabývat nejznámějším diskrétním rozdělením pravděpodobnosti - binomickým rozdělením. Začněme hned definicí binomického rozdělení, kterou pak osvětlíme na několika příkladech. Binomické rozdělení Uvažujme experiment takové povahy, že mohou nastat jen dva různé výsledky, které se navzájem vylučují (nemůže k nim dojít současně): „úspěch a „neúspěch („úspěch nemusí znamenat nic světoborného; označuje se tímto termínem proto, že se jedná o ten ze dvou možných výsledků, na který se ve svých úvahách chceme zaměřit). Pravděpodobnost úspěchu je p, pravděpodobnost neúspěchu 1 − p. Experiment n-krát nezávisle zopakujeme. „Nezávisle znamená, že výskyt úspěchu při předchozím opakování experimentu nemá vliv na to, zda při dalších opakováních nastane úspěch nebo neúspěch. Náhodná veličina X, která udává počet výskytů úspěchu při n nezávislých opakováních experimentu, má tzv. binomické rozdělení pravděpodobnosti s parametry n a p a nabývá hodnot z množiny {0, 1, 2, . . . , n} s pravděpodobností P(X = r) = n r · pr · (1 − p)n−r . Skutečnost, že veličina X má binomické rozdělení s parametry n, p, budeme označovat X ∼ Bi(n, p). Střední hodnota a rozptyl binomického rozdělení Má-li náhodná veličina X binomické rozdělení s parametry n, p, pak EX = np, DX = np(1 − p). Někdy se hodnoty veličiny s binomickým rozdělením uvádějí nikoliv v četnostech i (např. 12 úspěchů ze 20 pokusů), ale v podílech úspěšnosti i n (např. 12 20 ). Toto binomické rozdělení podílů úspěšnosti má stejné parametry n, p, ale díky jiným hodnotám, kterých 82 Významná diskrétní rozdělení pravděpodobnosti nabývá, je zde jiná střední hodnota a rozptyl: EX = n 0 i n · p(i) = 1 n · (střední hodnota veličiny četností) = 1 n · np = p. DX = n 0 i2 n2 · p(i) − (EX)2 = 1 n2 n 0 i2 p(i) − p2 = p(1 − p) n . Poznámka: Náhodná veličina X má alternativní rozdělení s parametrem p ∈ (0, 1) jestliže nabývá pouze hodnoty {0, 1} a P(X = 1) = p, P(X = 0) = 1 − p. Alternativní rozdělení je speciálním případem binomického rozdělení. Podívejme se nyní na konkrétní příklady. Příklad 6.3. Pravděpodobnost, že náhodně vybraný výrobek bude kvalitní, je 0,75. Vybereme náhodně pět výrobků. Náhodná veličina X udává počet kvalitních výrobků v uvedené vzorce pěti výrobků. Určete její rozdělení. Řešení. Nejdřív si je třeba uvědomit, že mezi vybranými výrobky nemusí být ani jeden kvalitní, nebo může být jeden kvalitní, dva kvalitní a tak dále až pět kvalitních výrobků, tedy X ∈ {0, 1, 2, 3, 4, 5}. Určeme pravděpodobnosti jednotlivých situací. • 0 kvalitních výrobků Všechny výrobky jsou nekvalitní a pravděpodobnost, že jeden je nekvalitní je 1 − − 0,75. Proto p(0) = (1 − 0,75)5 , což můžeme taky zapsat p(0) = 5 0 · 0,750 · (1 − 0,75)5 = 5 0 · 0,750 · 0,255 . To nám dává návod na určení dalších pravděpodobností. • 1 kvalitní výrobek V tomto případě jsou čtyři výrobky nekvalitní, a proto p(1) = 5 1 · 0,751 · (1 − 0,75)4 = 5 1 · 0,751 · 0,254 . • 2 kvalitní výrobky Z pěti výrobků máme dva kvalitní, tři nekvalitní, a proto p(2) = 5 2 · 0,752 · (1 − 0,75)3 = 5 2 · 0,752 · 0,253 . Podobně už určíme další pravděpodobnosti. 83 • 3 kvalitní výrobky p(3) = 5 3 · 0,753 · (1 − 0,75)2 = 5 3 · 0,753 · 0,252 . • 4 kvalitní výrobky p(4) = 5 4 · 0,754 · (1 − 0,75)1 = 5 4 · 0,754 · 0,251 . • 5 kvalitních výrobků p(5) = 5 5 · 0,755 · (1 − 0,75)0 = 5 5 · 0,755 · 0,250 Součet jednotlivých pravděpodobností musí být 1, protože se jedná o jevy neslučitelné, které zahrnují všechny situace, které můžou nastat. Náš součet je opravdu roven 1, vyzkoušejte si to! Pokud si ovšem vzpomenete ze střední školy na binomickou větu, nemusíte nic počítat. (a + b)n = n 0 · a0 · bn + n 1 · a1 · bn−1 + n 2 · a2 · bn−2 + ... n n · an · b0 . Stačí si uvědomit, že v našem případě je a = 0,75, b = 0,25 a n = 5. Proto náš součet je (0,75 + 0,25)5 = 15 = 1. Příklad 6.4. V předmětu IMA psali studenti 6 testů. Naše náhodná veličina X udává počet úspěšně napsaných testů studenta M.H. Pravděpodobnost úspěšnosti na testu studenta M.H. je vždy 0,85. Zjistěte rozdělení veličiny X a určete pravděpodobnost toho, že student M.H. a) bude úspěšný právě 3-krát, b) bude úspěšný alespoň 2-krát, c) nebude úspěšný víc než 2-krát, d) bude úspěšný jenom na prvním testu, e) bude úspěšný na prvním testu. Řešení. Nejdřív určíme rozdělení veličiny X. Zřejmě student M.H. může být úspěšný 0 až 6-krát, proto X ∈ {0, 1, 2, 3, 4, 5, 6}. • 0 úspěšných testů Všechny testy jsou neúspěšné a pravděpodobnost, že jeden je neúspěšný, je 1 − − 0,85 = 0,15. Proto p(0) = (0,15)6 , což můžeme taky zapsat jako p(0) = 6 0 · 0,850 · 0,156 , a to je návod na určení dalších pravděpodobností: 84 Významná diskrétní rozdělení pravděpodobnosti • 1 úspěšný test p(1) = 6 1 · 0,851 · 0,155 . • 2 úspěšné testy p(2) = 6 2 · 0,852 · 0,154 . • 3 úspěšné testy p(3) = 6 3 · 0,853 · 0,153 . • 4 úspěšné testy p(4) = 6 4 · 0,854 · 0,152 . • 5 úspěšných testů p(5) = 6 5 · 0,855 · 0,151 . • 6 úspěšných testů p(6) = 6 6 · 0,856 · 0,150 . Hned můžeme odpovědět na část a). Pravděpodobnost, že student M.H. bude úspěšný právě 3-krát, je P(A) = p(3) = 6 3 · 0,853 · 0,153 ˙=0,04145. Jev, že student M.H. bude úspěšný alespoň 2-krát, znamená, že M.H. bude úspěšný 2, 3, 4, 5 nebo 6-krát. Proto pro výsledek části b) by bylo třeba sečíst P(B) = p(2) + + p(3) + p(4) + p(5) + p(6), což není právě nejpříjemnější. Jednodušší je ale podívat se na doplňkový jev, tedy M.H. by byl úspěšný nejvíc 1-krát (nejvíc 1-krát = ani jednou nebo právě 1-krát) a pravděpodobnost tohoto jevu je součet p(0) + p(1). Pravděpodobnost našeho jevu je pak P(B) = 1 − (p(0) + p(1)) . = 0,9996, Část c) vlastně znamená, že student M.H. bude úspěšný maximálně 2-krát, proto pravděpodobnost tohoto jevu je součet P(C) = p(0) + p(1) + p(2) . = 0,005885. V části d) se jedná o situaci, kdy první test student M.H. zvládně úspěšně (p = 0,85), ale další testy budou určitě neúspěšné (p = 0,15 · 0,15 · 0,15 · 0,15 · 0,15), proto P(D) = 0,85 · 0,15 · 0,15 · 0,15 · 0,15 · 0,15 = 0,851 · 0,155 = 0,000064547. 85 Čím se liší části d) a e)? Není to stejné? V části d) je jasné, že kromě prvního testu jsou všechny zbylé neúspěšné. V části e) víme, že první test je úspěšný, a o úspěšnosti zbylých testů nevíme nic. Zřejmě rozdíl mezi pravděpodobnostmi v částech d) a e) bude. V části e) nás tedy zajímá jenom první test, a proto P(E) = 0,85. Příklad 6.5. Spočítejte očekávanou střední hodnotu úspěšně napsaných testů a rozptyl z předchozího příkladu na binomické rozdělení (příklad 6.4 o písemkách z IMA). Řešení. Protože se jedná o binomické rozdělení, počet všech pokusů (počet všech napsaných písemek) je 6 (n = 6) a pravděpodobnost úspěšně napsaného testu je p = 0,85. Proto je EX = n · p = 6 · 0,85 = 5,1 a DX = n · p · (1 − p) = 6 · 0,85 · 0,15 = 0,765. Kdybychom měli zjistit očekávanou hodnotu neúspěšně napsaných testů, počítali bychom s doplňkovou pravděpodobností EX = n · (1 − p) = 6 · 0,15 = 0,9. V případě rozptylu si stačí uvědomit, že v obou případech je výpočet stejný. Všimněte si součtu uvedených středních hodnot. A teď zkusíme úlohu 6.4 trochu pozměnit. Příklad 6.6. V předmětu IMA psali studenti 6 testů. Jestliže student nenapíše úspěšně nějaký test, nemůže psát už další testy (naštěstí je to jen příklad). Naše náhodná veličina X udává počet napsaných testů studenta M.H. Pravděpodobnost úspěšnosti na testu studenta M.H. je vždy 0,85. Zjistěte rozdělení veličiny X. Řešení. Naše náhodná veličina X nabývá hodnoty z množiny {1, 2, 3, 4, 5, 6}. Čím se příklad odlišuje od předchozího? Jestliže student nenapíše např. první test, další už psát nebude. To znamená, že přesně známe pořadí úspěšných a neúspěšných testů pro jednotlivé hodnoty veličiny X. Proto • 1 test to znamená, že první test byl neúspěšný a další už student M.H. nepsal. Pravděpodobnost, že test napíše neúspěšně, je 1 − 0,85 = 0,15. Tedy p(1) = 0,15 • 2 testy první test napsal úspěšně a druhý neúspěšně, proto p(2) = 0,85 · 0,15. Podobně určíme pravděpodobnost pro 3, 4 a 5 testů 86 Významná diskrétní rozdělení pravděpodobnosti • 3 testy p(3) = 0,852 · 0,15. • 4 testy p(4) = 0,853 · 0,15. • 5 testů p(5) = 0,854 · 0,15. • 6 testů v tomto případě bude trochu změna. Je třeba si uvědomit, že šest napsaných testů nemusí znamenat, že napsal všech šest testů úspěšně. Také se mohlo stát, že prvních pět napsal úspěšně a poslední test neúspěšně. Proto p(6) = 0,855 · 0,15 + 0,856 . Tento výsledek ještě můžeme upravit jako p(6) = 0,855 · (0,15 + 0,85) = 0,855 · 1 = 0,855 . Poslední výsledek může být interpretován takto: Student se propracuje k 6. testu, jestliže prvních 5 napsal úspěšně, což má pravděpodobnost právě 0,855 . Na výsledku šestého testu už pak nezáleží. Zřejmě naše náhodná veličina nemá binomické rozdělení, ale toho si už všímavý čtenář pravděpodobně všiml. Součet jednotlivých pravděpodobností je 1, ověřte si to! Vyřešili jsme dvě na první pohled stejné úlohy a každá z nich nás přivedla k jinému rozdělení pravděpodobností, proto doporučujeme si vždy pečlivě přečíst zadání úloh. V předchozí úloze náhodná veličina představovala počet pokusů při nezávislém opakování pokusů po první výskyt neúspěchu včetně toho neúspěšného. Kdyby celkový počet pokusů nebyl omezen (v tomto příkladu omezen byl – studenti psali 6 testů) a nepočítali bychom závěrečný neúspěšný pokus, dostali bychom tzv. geometrické rozdělení pravděpodobnosti. Geometrické rozdělení Jestliže náhodná veličina X udává počet úspěchů při nezávislém opakování pokusu po první výskyt neúspěchu a pravděpodobnost úspěchu je p, pro její pravděpodobnosti platí P(X = k) = pk · (1 − p) pro k = 0, 1, 2, ... Taková náhodná veličina má tzv. geometrické rozdělení pravděpodobnosti. Samozřejmě, tato ukončovací podmínka může být chápána i opačně jako čekání na úspěch (pak p je pravděpodobnost neúspěchu). Pro její střední hodnotu a rozptyl platí EX = p 1 − p , DX = p (1 − p)2 . 87 Zkusíme si příklad tohoto typu. Příklad 6.7. Jeden zlý učitel předmětu IMA dozkušuje ty studenty, kteří mají celkem 49 bodů, tím způsobem, že jim klade otázky tak dlouho, dokud nedostane nesprávnou odpověď. Pak nešťastníka vyhodí (naštěstí je to jen příklad). Naše náhodná veličina X udává počet úspěšně zodpovězených otázek studenta M. H. Dosti zjednodušeně budeme předpokládat, že pravděpodobnost úspěšné odpovědi je pro M. H. vždy 0,1. Zjistěte rozdělení veličiny X. Řešení. Naše náhodná veličina X nabývá hodnoty z množiny {0, 1, 2, . . . } (můžou ho, chudáka, zkoušet až do nekonečna). • 0 úspěšných odpovědí to znamená, že hned na první otázku odpověděl špatně a letěl. Pravděpodobnost, že odpoví špatně, je 1 − 0,1 = 0,9. Tedy p(0) = 0,9 = 0,10 · 0,9 • 1 úspěšná odpověď to znamená, že na první otázku uměl odpovědět a na druhou už ne. Tedy p(1) = 0,11 · 0,9 • 2 úspěšné odpovědi první dvě otázky zodpověděl úspěšně a třetí neúspěšně, proto p(2) = 0,12 · 0,9. • Obecně dostáváme pro k úspěšných odpovědí p(k) = 0,1k · 0,9, k = 0, 1, 2, . . . Jednalo se o geometrické rozdělení. Jak již bylo napsáno v posledním rámečku, u geometrického rozdělení někdy počítáme úspěšné pokusy před prvním neúspěchem a někdy neúspěšné pokusy před prvním úspěchem. Jestliže bereme v potaz, na kolikátý pokus se nám něco podařilo, pak příslušná náhodná veličina nemá sice přesně geometrické rozdělení, ale pravděpodobnosti se počítají velmi podobně. Ukážeme si to na následujícím příkladu. Příklad 6.8. Opakovaně házíme kostkou, dokud nepadne šestka. Náhodná veličina X udává, na kolikátý pokus šestka padla. Najděte pravděpodobnostní funkci náhodné veličiny X a vypočtěte její střední hodnotu. 88 Významná diskrétní rozdělení pravděpodobnosti Řešení. Kdyby X udávala počet hodů před prvním výskytem šestky, mohla by nabývat hodnot 0, 1, 2, . . . a měla by geometrické rozdělení s parametrem p = 5/6. Pro náš příklad však X nemůže být rovno 0 (nemůžeme hodit šestku na nultý pokus). V nejlepším případě nám šestka padne prvním pokusem a pravděpodobnost toho je p(1) = 1 6 . Pravděpodobnost, že poprvé šestka padne na druhý pokus, je p(2) = 5 6 · 1 6 a obecně p(k) = 5 6 k−1 1 6 , k = 1, 2, . . . Pro výpočet střední hodnoty je vhodné si uvědomit, že kdybychom měli náhodnou veličinu Y udávající počet „nešestek před první šestkou, tak střední hodnota této náhodné veličiny by byla EY = p 1 − p = 5 6 1 − 5 6 = 5. Pro naši náhodnou veličinu X platí X = Y + 1 – jestliže šestka padla poprvé např. na třetí pokus, tj. X = 3, pak před ní padly dvě „nešestky , tj. Y = 2, apod. Proto střední hodnota X je EX = E(Y + 1) = EY + 1 = 5 + 1 = 6. Na závěr uvedeme ještě jeden příklad: Příklad 6.9. Mezi stovkou výrobků je 20 zmetků. Náhodně vybereme 10 výrobků. Náhodná veličina X udává počet zmetků mezi vybranými výrobky. Určete její rozdělení. Řešení. Zřejmě X nabývá hodnoty {0, 1, 2, ..., 10} a nejedná se ani o binomické, ani geometrické rozdělení. Výpočet jednotlivých pravděpodobností by nám neměl způsobit problémy, v předchozích kapitolách jsme se již podobnou myšlenkou zabývali. • 0 zmetků to znamená, že všech 10 výrobků, které vybereme, bude kvalitních. Všech kvalitních je 100 − 20 = 80. Proto p(0) = 20 0 100−20 10−0 100 10 = 80 10 100 10 . • 1 zmetek jeden výrobek je některý z 20 zmetků a zbylých 9 výrobků budeme vybírat z 80 kvalitních výrobků. Tedy p(1) = 20 1 80 9 100 10 89 • 2 zmetky dva výrobky jsou zmetky a zbylých 8 jsou kvalitní, proto p(2) = 20 2 80 8 100 10 . A tak dále, až nakonec • 10 zmetků analogicky dostaneme p(10) = 20 10 80 0 100 10 . Tato jednoduchá úloha nás přivedla k dalšímu diskrétnímu rozdělení pravděpodobností. Jedná se o hypergeometrické rozdělení náhodné veličiny, kdy při opakování náhodného pokusu je výskyt sledovaného jevu závislý na výsledcích předcházejících pokusů. Jde tedy o pokusy, které jsou na sobě závislé. Typickým představitelem je výběr prvků bez vracení. Hypergeometrické rozdělení Uvažujeme situaci, kdy máme určitý soubor prvků. Celkový počet prvků je N. Z toho M prvků má sledovanou vlastnost. Ze souboru vybereme bez vracení n prvků. Náhodná veličina X udává počet prvků se sledovanou vlastností ve vybrané n-tici. Takováto náhodná veličina má hypergeometrické rozdělení s parametry N, M, n, kde N a M jsou přirozená čísla a n < N. Pravděpodobnostní funkce je určena předpisem P(X = k) = M k N−M n−k N n , k = max{0, n − (N − M)}, . . . , min{n, M}. Pro střední hodnotu a rozptyl hypergeometrického rozdělení platí EX = n M N , DX = n M N 1 − M N N − n N − 1 . V dalším příkladu si ukážeme ještě jinou možnost výpočtu pravděpodobnostní funkce u hypergeometrického rozdělení. Na základě toho pak uvidíme jistou souvislost mezi rozdělením hypergeometrickým a binomickým. Příklad 6.10. a) Máme košík s 10 jablky, z toho 30 % je červivých. Náhodně vybereme 4 jablka. Náhodná veličina X udává, kolik z nich je červivých. Najděte pravděpodobnostní funkci náhodné veličiny X, její střední hodnotu a rozptyl. b) Ze sadu bylo sklizeno 10 000 jablek, z toho 30 % je červivých. Náhodná veličina X opět udává počet červivých jablek ve vybrané čtveřici. Najděte pravděpodobnostní funkci, střední hodnotu a rozptyl náhodné veličiny X. Řešení. a) Pro 10 jablek celkem: Máme 3 jablka červivá a zbylých 7 je zdravých. 90 Významná diskrétní rozdělení pravděpodobnosti • 0 červivých, tj. všechna zdravá. Pravděpodobnost bychom mohli počítat pomocí kombinačních čísel: p(0) = 7 4 10 4 = 35 210 = 1 6 . Můžeme však k problému přistoupit i jinak. Budeme jablka brát postupně. Všechna 4 musí být zdravá. Pravděpodobnost, že první jablko, které jsme vybrali, je zdravé, je 7/10. Když vybíráme druhé jablko, celkem zbývá jablek už jen 9, z toho zdravých je 6. Proto pravděpodobnost, že druhé jablko je zdravé, je 6/9. Podobně pak pro třetí a čtvrté jablko. Pravděpodobnost, že všechna jablka jsou zdravá, je p(0) = 7 10 · 6 9 · 5 8 · 4 7 = 1 6 . Dospěli jsme ke stejnému výsledku postupem, který se na první pohled může zdát jednodušší než ten s kombinačními čísly. Pro nenulové počty červivých jablek se ale objeví komplikace. • 1 červivé Pomocí kombinačních čísel dostaneme p(1) = 3 1 · 7 3 / 10 4 = 1/2. Teď budeme jablka brát postupně. Musí být jedno červivé a všechna ostatní zdravá. Pravděpodobnost, že první jablko je červivé, je 3/10. Druhé červivé má pravděpodobnost 7/9 atd. Zdálo by se, že výsledek bude 3 10 · 7 9 · 6 8 · 5 7 = 1 8 . Vyšlo to jinak, něco je špatně! Problém je podobný jako u binomického rozdělení: právě vypočtená hodnota není pravděpodobnost, že jedno jablko ze čtyř je červivé, ale že první jablko je červivé a ostatní zdravá. Musíme ještě probrat možnosti, že červivé je druhé, třetí a čtvrté jablko. Celkem dostaneme p(1) = 3 10 · 7 9 · 6 8 · 5 7 + 7 10 · 3 9 · 6 8 · 5 7 + 7 10 · 6 9 · 3 8 · 5 7 + 7 10 · 6 9 · 5 8 · 3 7 Když si jednotlivé sčítance prohlédneme, zjistíme, že ve jmenovateli je vždy 10·9·8·7. V čitateli vždy násobíme čísla 3, 7, 6 a 5, mění se jen jejich pořadí. Celkem tedy máme p(1) = 4 · 3 10 · 7 9 · 6 8 · 5 7 = 4 · 1 8 = 1 2 . • 2 červivá Pomocí kombinačních čísel: p(2) = 3 2 · 7 2 / 10 4 = 3/10. Po jednotlivých kusech: Pravděpodobnost, že první dvě jablka jsou červivá a druhá dvě zdravá, je 3 10 · 2 9 · 7 8 · 6 7 = 1 20 91 Toto číslo musíme vynásobit počtem všech možností, jak mohla být dvě červivá jablka ve vybrané čtveřici rozmístěna, což je 4 2 . Celkem p(2) = 4 2 · 3 10 · 2 9 · 7 8 · 6 7 = 6 · 1 20 = 3 10 . • 3 červivá p(3) = 4 3 · 3 10 · 2 9 · 1 8 · 7 7 = 1 30 . Můžete se přesvědčit, že pomocí kombinačních čísel vyjde totéž. Pravděpodobnostní funkce je tímto popsána, protože více než 3 červivá jablka ve vybrané čtveřici být nemohou. • Střední hodnota a rozptyl Dosadíme do vzorců s N = 10, M = 3 a n = 4 (případně bychom mohli použít univerzální vzorce EX = xip(xi), podobně pro DX): EX = 4 · 3 10 = 6 5 = 1,2, DX = 4 · 3 10 · 1 − 3 10 · 10 − 4 10 − 1 = 14 25 = 0,56. b) Pro 10 000 jablek celkem, z toho 3 000 červivých a 7 000 zdravých: Nebudeme probírat celou pravděpodobnostní funkci, na ukázku vezmeme např. p(2). Provedeme-li výpočet způsobem předvedeným v části a), dostaneme p(2) = 4 2 3 000 10 000 · 2 999 9 999 · 7 000 9 998 · 6 999 9 997 . Proč tento příklad vlastně počítáme? Vždyť je to stejné jako a), jen s většími čísly! Uvidíme hned – vyčíslíme jednotlivé zlomky: 3 000 10 000 = 0,3, 2 999 9 999 . = 0,3, 7 000 9 998 . = 0,7, 6 999 9 997 . = 0,7 Je vidět, že to, že už jsme jedno jablko vybrali, téměř neovlivní pravděpodobnost červivosti pro druhé jablko. Je to dáno velkým celkovým počtem jablek – když jedno ubereme, nestane se skoro nic. U předchozího příkladu s 10 jablky pravděpodobnost červivosti druhého jablka závisela na tom, jestli první jablko červivé bylo nebo nebylo. Hodnotu p(2) můžeme přibližně vyjádřit jako p(2) . = 4 2 · 0,32 · 0,72 , což je pravděpodobnost pro binomické rozdělení. Vyčíslit tento výraz dá mnohem méně práce než počítat s původním vzorcem pro hypergeometrické rozdělení a nepřesnost, které se tím dopustíme, je velmi malá. 92 Významná diskrétní rozdělení pravděpodobnosti Vypočteme ještě střední hodnotu a rozptyl. Nejprve přesně, tj. pomocí vzorců pro hypergeometrické rozdělení. Za M/N dosazujeme 3 000/10 000 = 0,3: EX = 4 · 0,3 = 1,2, DX = 4 · 0,3 · (1 − 0,3) · 10 000 − 4 10 000 − 1 . = 0,8397. Pro srovnání, kdybychom použili vzorce pro binomické rozdělení s n = 4 a p = 0,3, dostali bychom EX stejně, zatímco rozptyl by byl DX = 4 · 0,3 · 0,7 = 0,84 čili vyšel by skoro stejně jako pro rozdělení hypergeometrické. Právě předvedený příklad můžeme zobecnit: Vztah hypergeometrického a binomického rozdělení Máme-li náhodnou veličinu X s hypergeometrickým rozdělení, kde čísla N a M jsou velká, zatímco n je vzhledem k nim malé, můžeme s náhodnou veličinou X počítat, jako kdyby měla binomické rozdělení s parametry n a p = M/N. Tento fakt se často používá. Předvedeme si to na příkladu. Příklad 6.11. Senátor Kadrnožka před volbami tvrdí, že jej bude volit 70 % voličů. Předpokládejme, že má pravdu. Provedeme průzkum mezi 10 lidmi odhodlanými jít volit. Jaká je pravděpodobnost, že pro Kadrnožku jich bude právě 7? Řešení. Kdybychom chtěli tento příklad řešit přesně, museli bychom vědět, kolik lidí v Kadrnožkově volebním obvodu půjde k volbám – to by bylo dosazeno za N. Z toho 70 % by bylo M. Pak bychom použili vzorec pro hypergeometrické rozdělení. My počet voličů neznáme, avšak lze předpokládat, že bude velký. Nebo aspoň velký vzhledem k 10. Můžeme tedy říci, že u každého jednotlivého člověka je pravděpodobnost 70 %, že bude volit Kadrnožku. A proto p(7) = 10 7 · 0,77 · 0,33 . = 0,267. 6.1 Příklady na samostatnou práci Zde uvádíme neřešené úlohy na různé typy rozdělění náhodné proměnné. Zřejmě to bude náročnější než v předchozích kapitolách, kde jste měli dopředu dané, o jaký typ rozdělení se jedná, ale taková je realita života. Tak mnoho zdaru! Příklad 6.12. Pravděpodobnost toho, že student David přijde pozdě do školy, je každý den 0,2. Náhodná proměnná X udává počet jeho pozdních příchodů v průběhu 20 pracovních dnů. a) Určete její pravděpodobnostní funkci. b) Určete její střední hodnotu a rozptyl. c) Určete pravděpodobnost toho, že David bude mít právě 7 pozdních příchodů. 6.1 Příklady na samostatnou práci 93 Výsledek: a) p(k) = 20 k · 0,2k · 0,820−k ; b) EX = 4, DX = 3,2; c) 20 7 · 0,27 · 0,813 . = 0,055 Příklad 6.13. Házíme 6-krát šestistěnnou kostkou. Náhodná veličina X udává počet padnutých jedniček. a) Určete její pravděpodobnostní funkci. b) Určete její střední hodnotu a rozptyl. c) Určete pravděpodobnost toho, že jednička padne právě třikrát. d) Určete pravděpodobnost toho, že jednička padne minimálně třikrát. e) Určete pravděpodobnost toho, že jednička padne nejvíc pětkrát. Výsledek: a) p(k) = 6 k · 1 6 k · 5 6 6−k ; b) EX = 1, DX = 5/6; c) přibl. 0,0536; d) přibl. 0,0623; e) 1 − 1/66 . = 0,99998 Příklad 6.14. Házíme čtyřikrát mincí. Náhodná veličina X udává, kolikrát padl znak (rub mince). a) Určete její pravděpodobnostní a distribuční funkci. b) Určete její střední hodnotu a rozptyl. c) Určete pravděpodobnost toho, že znak padne právě dvakrát. d) Určete pravděpodobnost toho, že znak padne minimálně dvakrát. e) Určete pravděpodobnost toho, že znak padne nejvíc dvakrát. Výsledek: a) p(k) = 4 k · 1 2 k · 1 2 4−k , F(x) = 0 pro x < 0, F(x) = 1/16 pro x ∈ 0, 1), F(x) = 5/16 pro x ∈ 1, 2), F(x) = 11/16 pro x ∈ 2, 3), F(x) = 15/16 pro x ∈ 3, 4), F(x) = 1 pro x ≥ 4; b) EX = 2, DX = 1; c) 3/8; d) 11/16; e) 11/16 Příklad 6.15. Třikrát vystřelíme na cíl. Pravděpodobnost zásahu při každém výstřelu je p = 0,7. Náhodná proměnná X udává počet zásahů cíle. a) Určete její pravděpodobnostní a distribuční funkci. b) Určete její střední hodnotu a rozptyl. c) Určete pravděpodobnost toho, že budeme mít právě 2 zásahy cíle. Výsledek: a) p(k) = 3 k · 0,7k · 0,33−k , F(x) = 0 pro x < 0, F(x) = 0,027 pro x ∈ 0, 1), F(x) = 0,216 pro x ∈ 1, 2), F(x) = 0,657 pro x ∈ 2, 3), F(x) = 1 pro x ≥ 3; b) EX = 2,1, DX = 0,63; c) 0,441 Příklad 6.16. (Příklad statistického řízení procesu:) Každou hodinu je vybrán vzorek 20 součástí procesu perforace (= prorážení) kovu. Průměrně 4% výsledků vyžadují dodatečné úpravy. Náhodná veličina X označuje počet součástí z vybraných dvaceti, které vyžadují dodatečné úpravy. Pokud veličina X překročí svou střední hodnotu o více než trojnásobek své směrodatné odchylky, pracovní linka se musí zastavit a opravit. a) Jaká je pst, že X překročí svou střední hodnotu o více než trojnásobek své směrodatné odchylky? b) Jaká je pst, že X překročí hodnotu 1 aspoň v jedné z následujících pěti hodin provozu? Výsledek: a) P(X > EX + 3 √ DX) = P(X > 3,43) . = 0,0074; b) Mezivýsledek: P(X > 1) . = 0,1897, výsledek: 1 − (1 − 0,1897)5 . = 0,6506 94 Významná diskrétní rozdělení pravděpodobnosti Příklad 6.17. Zuzanka hází míčkem na cíl, pravděpodobnost zásahu je 0,6. Dostala 7 míčků a všechny chce vyzkoušet. Náhodná proměnná X udává počet zásahů cíle. a) Určete její pravděpodobnostní funkci. b) Určete její střední hodnotu a rozptyl. c) Určete pravděpodobnost toho, že Zuzanka zasáhne cíl alespoň dvakrát. Výsledek: a) p(i) = 7 i · 0,6i · 0,47−i , i ∈ {0, 1, . . . , 7}, b) EX = 4, 2; DX = 1, 68 c) P(X ≥ 2) = 0,9811584. Příklad 6.18. Pravděpodobnost výskytu jistého slova v jazyku je 0,05. Kolik slov musíme mít v textu, aby se v něm s pravděpodobností 0,99 tohle slovo vyskytlo alespoň jednou? Výsledek: 90 Příklad 6.19. Výrobní podnik expedoval zásilku, která obsahuje 20 výrobků. Pravděpodobnost toho, že se jeden výrobek během přepravy poškodí, je 0,1. Diskrétní náhodná veličina X udává počet poškozených výrobků. a) Určete její pravděpodobnostní funkci. b) Určete její střední hodnotu. c) Určete pravděpodobnost toho, že se během přepravy poškodí více než 3 výrobky. Výsledek: a)p(i) = 20 i · 0,1i · 0,920−i , i ∈ {0, 1, . . . , 20} b) EX = 0,5. Příklad 6.20. Automatická linka produkuje 95% výrobků první kvality a 5% zmetků. Ze 100 kusů vybereme náhodně 10 kusů. Diskrétní náhodná veličina X udává počet zmetků z vybraných deseti kusů. a) Určete její pravděpodobnostní funkci. b) Určete její střední hodnotu. Výsledek: a)p(i) = ( 95 10−i)·(5 i) (100 10 ) , i ∈ {0, 1, . . . , 5} b) EX = 0,5. Příklad 6.21. Elektronická váha v automatizovaném provozu zastaví balicí linku poté, co zaznamená dva balíky v těsném sledu za sebou s jinou hmotností, než je požadováno. V každém případě je balicí linka zastavena po zabalení pátého balíku. Při každém balení má balík požadovanou hmotnost s pravděpodobností 0,9. Jednotlivá balení jsou považována za nezávislá na ostatních baleních. Veličina X udává počet balíků s požadovanou hmotností zabalených před prvním zastavením linky. a) Určete pravděpodobnostní funkci veličiny X. b) Určete střední hodnotu veličiny X. 6.1 Příklady na samostatnou práci 95 Výsledek: a) p(0) = 0,01; p(1) = 0,0099; p(2) = 0,01053; p(3) = 0,05103; p(4) = 0,32805; p(5) = = 0,59049 b) EX = 4, 4487. Příklad 6.22. * Pravděpodobnost zásahu terče 0,5. Kolik pokusů o zásah musíme udělat, aby s pravděpodobností 0,75 byl terč zasažen právě dvakrát? Výsledek: n = 3. 96 Exponenciální a Poissonovo rozdělení pravděpodobnosti 7 Exponenciální a Poissonovo rozdělení pravděpodobnosti V této kapitole se seznámíme s dalšími dvěma typy rozdělení pravděpodobnosti, které jsou využívány v úlohách technické praxe. I když Poissonovo rozdělení je diskrétní a exponenciální rozdělení spojité, existuje mezi nimi blízký vztah - každé z nich sice používáme k popisu jiné veličiny, ale hodnoty těchto veličin měříme v jedné a téže situaci. Poissonovo rozdělení Náhodná veličina X má Poissonovo rozdělení pravděpodobnosti s parametrem λ > 0 (píšeme X ∼ Po(λ)), jestliže nabývá hodnot 0, 1, 2, 3, . . . s pravděpodobností p(k) = P(X = k) = λk k! · e−λ pro k = 0, 1, 2, 3, . . . . Tento vzorec používáme, když se ptáme na pravděpodobnost, že nastane právě k událostí za jednu časovou jednotku, přičemž víme, že průměrně nastane za tuto časovou jednotku λ událostí. Nemusí ale jít jen o jednotky časové, může jít i o jednotky délky, obsahu a pod. Střední hodnota a rozptyl Poissonova rozdělení jsou EX = λ, DX = λ. Občas je třeba zjistit pravděpodobnost, že nastane právě k událostí za t časových jednotek, když víme, že průměrně nastane λ událostí za jednu časovou jednotku. Snadno určíme, že za t časových jednotek nastane průměrně λ · t událostí, a proto pro náhodnou veličinu Y udávající počet událostí za t časových jednotek platí p(k) = P(Y = k) = (λ · t)k k! · e−λ·t pro k = 0, 1, 2, 3, . . . . Samozřejmě, problém můžeme vyřešit i tak, že si pro novou časovou jednotku přepočítáme λ a použijeme předchozí vzoreček. Na následujícím příkladu si podrobně vysvětlíme význam parametrů λ a k ve vzorcích. Příklad 7.1. Do restaurace přijde průměrně 20 lidí za hodinu. Určete pravděpodobnost toho, že 97 • v průběhu 5 minut přijdou alespoň 2 lidé, • v průběhu 15 minut nepřijde nikdo, • v průběhu 5 minut nepřijde nikdo, • v průběhu hodiny přijde právě 20 lidí, • v průběhu hodiny přijde právě 15 lidí. Řešení. Víme, že za hodinu přijde průměrně 20 lidí, proto pro časovou jednotku 1 hodina je λ = 20. Postupně vyřešíme jednotlivé úkoly: • v průběhu 5 minut přijdou alespoň 2 lidé: V tomto případě vidíme, že časové jednotky nejsou stejné, proto si musíme uvědomit, že 5 minut je 1 12 z hodiny a že bude vhodné použít druhý vzoreček. Zřejmě bude výhodnější použít vědomosti o doplňkovém jevu: P(X ≥ 2) = 1 − P(X = 0) − P(X = 1), a proto P(X ≥ 2) = 1 − 20 · 1 12 0 0! · e−20· 1 12 − 20 · 1 12 1 1! · e−20· 1 12 = 1 − e−5 3 · 1 + 5 3 . Postupovat jsme mohli i tak, že bychom určili λ pro novou časovou jednotku, tedy pro časovou jednotku 5 minut. Když za hodinu přijde průměrně 20 lidí, tak za 5 minut to bude průměrně 5 3 lidí. A už můžeme použít první vzoreček, samozřejmě opět využijeme doplňkový jev: P(X ≥ 2) = 1 − 5 3 0 0! · e−5 3 − 5 3 1 1! · e−5 3 = 1 − e−5 3 · 1 + 5 3 . • v průběhu 15 minut nepřijde nikdo: Máme zjistit P(X = 0) a naše časové jednotky jsou opět různé, první výpočet uděláme pro λ = 20 a t = 1 4 (15 minut je 1 4 z hodiny). P(X = 0) = 20 · 1 4 0 0! · e−20· 1 4 = e(−5) . Úloha se dala řešit i tak, že si zjistíme, kolik lidí přijde průměrně za 15 minut. To je čtvrtina z 20, tedy 5 lidí. Proto P(X = 0) = (5)0 0! · e−5 = e(−5) . 98 Exponenciální a Poissonovo rozdělení pravděpodobnosti • v průběhu 5 minut nepřijde nikdo: Využijeme zkušenosti z předchozích příkladů: P(X = 0) = 20 · 1 12 0 0! · e−20· 1 12 = e(−5 3 ) nebo P(X = 0) = 5 3 0 0! · e−5 3 = e(−5 3 ) . • v průběhu hodiny přijde právě 20 lidí: V tomto případě máme stejné časové jednotky, proto P(X = 20) = 2020 20! · e−20 . • v průběhu hodiny přijde právě 15 lidí: Zřejmě P(X = 15) = 2015 15! · e−20 . Nyní předvedeme příklad, kdy nepůjde zrovna o události v čase. Příklad 7.2. Ve sbírce příkladů se vyskytuje průměrně 1 chyba na pět stránek. Určete pravděpodobnost, že • na stránce, kterou si zrovna prohlížíme, je právě jedna chyba, • na stránce, kterou si zrovna prohlížíme, je aspoň jedna chyba. • na stránce, kterou si zrovna prohlížíme, je více než jedna chyba. • Dále určete, jaký je očekávaný (střední) počet chyb na deseti stránkách a jaká je pravděpodobnost, že na deseti stránkách se vyskytne právě tento počet chyb. Řešení. Pro první tři úkoly označíme X počet chyb na jedné stránce. Za jednotku (i když ne zrovna časovou) tedy považujeme jednu stranu textu. Parametr λ je pak roven 1/5 = = 0,2. Další výpočet probíhá obvyklým způsobem. • Právě jedna chyba na stránce: P(X = 1) = 0,21 1! · e−0,2 . = 0,164. • Aspoň jedna chyba na stránce: P(X > 0) = 1 − P(X = 0) = 1 − 0,20 0! · e−0,2 . = 0,181. 99 • Více než jedna chyba: Můžeme použít předchozí výsledky: P(X > 1) = P(X > 0) − P(X = 1) . = 0,017. • Na deseti stránkách očekáváme dvě chyby. Označíme-li Y počet chyb na deseti stranách, pak Y ∼ Po(2) a P(Y = 2) = 22 2! · e−2 . = 0,271. Exponenciální rozdělení Spojitá náhodná veličina X má exponenciální rozdělení s parametrem λ > 0 (píšeme X ∼ Exp(λ)), jestliže má hustotu f danou předpisem f(t) = 0 pro t < 0, λ · e−λt pro t ≥ 0. Její distribuční funkce je F(t) = 0 pro t < 0, 1 − e−λt pro t ≥ 0. Náhodná veličina s exponenciálním rozdělením popisuje dobu čekání na další událost (resp. délku časového intervalu mezi dvěma událostmi), jestliže průměrně nastává λ událostí za jednotku času. Střední hodnota a rozptyl jsou EX = 1 λ , DX = 1 λ2 . Užití exponenciálního rozdělení objasníme na následujícím příkladu. Příklad 7.3. Do restaurace přijde průměrně 20 lidí za hodinu. Určete pravděpodobnost toho, že • v průběhu 15 minut nepřijde nikdo, • v průběhu 5 minut nepřijde nikdo, Řešení. • v průběhu 15 minut nepřijde nikdo: Nejdřív si uvědomíme, že za 15 minut přijde průměrně 5 lidí, proto – pro časovou jednotku 15 minut – je λ = 5. Úlohu jsme již vyřešili užitím Poissonova rozdělení, ale snadno se dá aplikovat i exponenciální rozdělení, stačí si uvědomit, že když v průběhu 15 minut nepřijde nikdo, znamená to, že mezi dvěma příchody bude doba delší nebo rovna 15 minut. Proto P(X ≥ 1) = 1 − P(X < 1) = e(−5) . 100 Exponenciální a Poissonovo rozdělení pravděpodobnosti • v průběhu 5 minut nepřijde nikdo: Využijeme zkušenosti z předchozí části, stačí určit parametr λ. Ale to už umíme, λ = 5 3 . Proto P(X ≥ 1) = 1 − P(X < 1) = e(−5 3 ) . Zkusíme trochu jiný příklad: Příklad 7.4. Roční dítě, když se nechá bez dozoru, dovede rozbít nebo pokazit průměrně 4 hračky za hodinu. Jak dlouho ho může maminka nechat bez dozoru, aby s pravděpodobností 0,9 nenastal problém? Řešení. Zřejmě potřebujeme zjistit čas, za který nedojde k rozbití hračky s pravděpodobností 0,9, a víme, že jestliže za časovou jednotku zvolíme 1 hodinu, pak λ = 4. Potom P(X > t) = 1 − P(X ≤ t) = 1 − P(X < t) = 1 − F(t) = 0,9 Proto F(t) = 0,1, teda 1 − e−4t = 0,1 ⇒ t = ln 0,9 −4 . = 0,0263 Čas t . = 0,0263, co je přibližně 1,58 minut. Poissonovo rozdělení se občas hodí např. na aproximaci binomického rozdělení, a to v případě, že n je „velké a p „malé . Za parametr λ se bere součin n · p. Vyvětlíme to na následujícím příkladu. Příklad 7.5. Dělnice obsluhuje 800 vřeten, na které navíjí přízi. Pravděpodobnost roztržení příze za čas t je na každém z nich 0,005. Jaká je pravděpodobnost toho, že se za čas t příze roztrhne právě na čtyrech vřetenech? Řešení. Jedná se o binomické rozdělení, proto P(X = 4) = 800 4 · 0,0054 · (1 − 0,005)800−4 . = 0,1959. Aproximujme binomické rozdělení Poissonovým, λ = n · p = 800 · 0,005 = 4, proto P(X = 4) = e−4 · 44 4! . = 0,1954. Vidíme, že výsledky se liší jen nepatrně a výpočet pomocí Poissonova rozdělení byl přitom mnohem méně pracný. Pokusíme se vysvětlit, proč lze tuto aproximaci použít. Na problém se podíváme z jiné strany: Jak se asi mohlo přijít na to, že pro každé vřeteno je pravděpodobnost přetržení příze zrovna 0,005? Patrně se za čas t průměrně trhá příze na 4 vřetenech (pak je pro jedno vřeteno pravděpodobnost přetržení příze 4/800 = 0,005. Počítáme tedy události, 7.1 Příklady pro samostatnou práci 101 přičemž víme, že průměrně jich nastane λ = 4 za danou jednotku času, a to je přesně situace pro použití Poissonova rozdělení. V případě Poissonova rozdělení je EX = DX = λ. Když aproximujeme binomické rozdělení Poissonovým, mělo by pro binomické rozdělení platit něco podobného. Proto tuto aproximaci použijeme, když není velký rozdíl mezi EX a DX. Protože u binomického rozdělení s parametry n a p je EX = n · p a DX = n · p · (1 − p), jsou si tyto hodnoty blízké v případě, že 1 − p je blízké jedné, tj. p je blízké nule. 7.1 Příklady pro samostatnou práci Příklad 7.6. Do restaurace přijde průměrně 20 zákazníků za půlhodinu. Určete pravděpodobnost toho, že a) v průběhu 5 minut přijdou alespoň dva zákazníci, b) v průběhu 15 minut nepřijde ani jeden zákazník, c) v průběhu 5 minut nepřijde ani jeden zákazník, d) v průběhu jedné hodiny přijde právě 20 zákazníků, e) v průběhu jedné hodiny přijde právě 15 zákazníků. Výsledek: a) 1 − 13 3 · e −10 3 ; b) e−10 ; c) e −10 3 ; d) 4020 20! · e−40 ; e) 4015 15! · e−40 Příklad 7.7. Do kanceláře přijdou průměrně 2 studenti za hodinu. Určete pravděpodobnost toho, že a) v průběhu 5 minut přijdou alespoň dva studenti, b) v průběhu 15 minut nepřijde ani jeden student, c) v průběhu jedné hodiny přijdou právě 2 studenti, d) doba mezi dvěma po sebe jdoucími příchody studentů je v intervalu 10min, 50min . Výsledek: a) 1 − 7 6 · e −1 6 ; b) e−0,5 ; c) 2 · e−2 ; d) přibližně 0,5278 Příklad 7.8. Do třídy přijde průměrně 5 opozdilých studentů za vyučovací hodinu (50 minut) . Určete pravděpodobnost toho, že a) v průběhu 5 minut přijdou alespoň dva opozdilci, b) v průběhu 5 minut nepřijde ani jeden student, c) v průběhu 15 minut přijde alespoň jeden student, d) v průběhu jedné vyučovací hodiny přijde právě 20 studentů, e) v průběhu jedné vyučovací hodiny nepřijde ani jeden opozdilý student. Výsledek: a) 1 − 3 2 · e −1 2 ; b) e− 1 2 ; c) 1 − e −3 2 ; d) 520 20! · e−5 ; e) e−5 Příklad 7.9. Roční dítě je nutno průměrně 7-krát za den přebalit. Když se nechá bez dozoru, dovede rozbít nebo pokazit průměrně 4 hračky za hodinu. Jak dlouho ho může maminka nechat bez dozoru, aby s pravděpodobností 0,9 nenastal ani jeden z uvedených problémů? Výsledek: Přibližně 1,473 min 102 Exponenciální a Poissonovo rozdělení pravděpodobnosti Příklad 7.10. Náhodná veličina X má Poissonovo rozdělení se střední hodnotou EX = = 3. Určete a) pravděpodobnost toho, že náhodná veličina nabývá hodnoty menší než její střední hodnota, b) pravděpodobnost toho, že náhodná veličina nabývá kladné hodnoty. Výsledek: a) 0,423; b) 0,950 Příklad 7.11. Do telefonní ústředny přijde za hodinu průměrně 120 hovorů. Určete jaká je pravděpodobnost toho, že za dvě minuty přijdou do ústředny právě dva hovory. Výsledek: 8 · e−4 Příklad 7.12. Telefonní ústředna obsluhuje 3000 účastníků. Pravděpodobnost, že libovolný účastník bude telefonovat v průběhu hodiny je p = 0, 002. Náhodná veličina X udává počet účastníků, kteří budou v průběhu hodiny telefonovat. Vypočítejte pravděpodobnost toho, že v průběhu hodiny budou telefonovat právě čtyři účastníci. Výsledek: P(X = 4) = 54 · e−6 Příklad 7.13. Výrobní zařízení má poruchu v průměru jednou za 2000 hodin. Předpokládejme, že „doba čekání na poruchu je náhodná veličina s exponenciálním rozdělením. Určete hodnotu t tak, aby pravděpodobnost, že přístroj bude pracovat delší dobu než t, byla 0,99. Výsledek: Přibližně 20,5 hodin Příklad 7.14. Na jednom metru vlny se průměrně vyskytují dva uzlíky. Vypočtěte pravděpodobnost, že na dvou metrech vlny bude tři až pět uzlíků. Výsledek: Přibližně 0,547 Příklad 7.15. Počet povrchových kazů na plastových deskách použitých v interiéru auta má Poissonovo rozdělení se střední hodnotou 0,005 kazu na decimetr čtvereční. Předpokládejme, že celková plocha těchto desek v jednom autě je 1 metr čtvereční. a) Jaká je pravděpodobnost, že v autě není žádný kaz? b) Jestliže si podnik objedná pět aut, jaká je pravděpodobnost, že se v žádném z nich povrchové kazy neobjeví? Výsledek: a) P(X = 0) = e−0,5 . = 0,607; b) (e−0,5 )5 . = 0,082 Příklad 7.16. Učitel zapisuje body 200 studentům do informačního systému. Ze zkušenosti ví, že u každého záznamu je pravděpodobnost chyby 0,01. Vypočtěte pravděpodobnost, že učitel udělá dvě až tři chyby a) pomocí binomického rozdělení, b) pomocí Poissonova rozdělení. Výsledek: Přibližně: a) 0,453; b) 0,451 103 8 Normální rozdělení 8.1 Základní pojmy a řešené příklady Normální rozdělení Spojitá náhodná veličina X s hustotou f(x) = 1 √ 2π σ e− (x−µ)2 2σ2 , x ∈ (−∞, ∞), kde µ ∈ (−∞, ∞) a σ > 0 jsou konstanty, se nazývá náhodná veličina s normálním rozdělením. Platí EX = µ, DX = σ2 . To, že náhodná veličina X má normální rozdělení se střední hodnotou µ a rozptylem σ2 , zapisujeme jako X ∼ N(µ, σ2 ). Standardizované normální rozdělení Jesliže má náhodná veličina normální rozdělení se střední hodnotou µ = 0 a rozptylem σ2 = 1, říkáme, že tato náhodná veličina má standardizované normální rozdělení a značíme ji U. Platí tedy U ∼ N(0, 1). Distribuční funkce náhodné veličiny U se značí Φ, tj. (podle obecné definice distribuční funkce) Φ(u) = P(U ≤ u). Hodnoty funkce Φ jsou tabelovány (viz tabulka 9.1). Jestliže X je náhodná veličina s normálním rozdělením se střední hodnotou µ a rozptylem σ2 , X ∼ N(µ, σ2 ), pak X − µ σ = U. Vzorce pro výpočty pravděpodobností nerovností různého typu jsme už uváděli pro obecnou náhodnou veličinu se spojitým rozdělením. Nyní vše zopakujeme speciálně pro náhodnou veličinu U a její distribuční funkci Φ. 104 Normální rozdělení Výpočty různých pravděpodobností pro U pomocí Φ P(U ≤ u) = Φ(u) P(U > u) = 1 − Φ(u) P(u1 < U ≤ u2) = Φ(u2) − Φ(u1). Ve všech uvedených vztazích lze zaměnit ostré a neostré nerovnosti. Pro funkci Φ navíc platí vztah Φ(−u) = 1 − Φ(u). Výpočty různých pravděpodobností pro obecné normální rozdělení Jestliže X ∼ N(µ, σ2 ), pak pro výpočty různých pravděpodobností využijeme transformační vztah mezi X a U. Konkrétně, P(X ≤ x) = P(U ≤ x−µ σ ) P(X > x) = P(U > x−µ σ ) P(x1 < X ≤ x2) = P(x1−µ σ < U ≤ x2−µ σ ). Dál pak počítáme s náhodnou veličinou U, viz předchozí rámeček. Příklad 8.1. Vypočtěte pravděpodobnosti: a) P(U < 1,67) b) P(U > 0,35) c) P(0,35 < U < 1,67) d) P(U < −0,35) e) P(U > −1,67) f) P(−1,5 < U < 0,5) Řešení. Budeme postupovat podle výše uvedených vzorců, příslušné hodnoty funkce Φ najdeme vždy v tabulce. a) P(U < 1,67) = Φ(1,67) . = 0,953 b) P(U > 0,35) = 1 − Φ(0,35) . = 1 − 0,637 = 0,363 c) P(0,35 < U < 1,67) = Φ(1,67) − Φ(0,35) . = 0,953 − 0,637 = 0,316 d) P(U < −0,35) = Φ(−0,35) = 1 − Φ(0,35) . = 1 − 0,637 = 0,363 e) P(U > −1,67) = 1 − Φ(−1,67) = 1 − (1 − Φ(1,67)) = Φ(1,67) . = 0,953 f) P(−1,5 < U < 0,5) = Φ(0,5)−Φ(−1,5) = Φ(0,5)−(1−Φ(1,5)) = Φ(0,5)−1+Φ(1,5) . = . = 0,691 − 1 + 0,933 = 0,624 Jako ilustrace k právě uvedeným výpočtům slouží obrázky 8.1. Zdůrazněme, že je na nich vždy graf hustoty normálního rozdělení s µ = 0 a σ2 = 1. Příslušnou pravděpodobnost počítáme jako obsah plochy pod grafem hustoty na odpovídajícím intervalu. Na obrázku a) šedě vybarvená plocha přímo udává hodnotu distribuční funkce v bodě 1,67. Na obrázku b) by hodnota Φ(0,35) byl obsah bílé plochy. Obsah vybarvené plochy na obrázku c) 8.1 Základní pojmy a řešené příklady 105 a) −3 0 3 u y y = f(u) 1,67 b) −3 3 u y y = f(u) 0,35 c) −3 3 u y y = f(u) 1,670,35 d) −3 3 u y y = f(u) −0,35 e) −3 0 3 u y y = f(u) −1,67 f) −3 3 u y y = f(u) −1,5 0,5 Obr. 8.1: K příkladu 8.1 dostaneme tak, že odečteme obsah šedé plochy z obrázku a) a bílé plochy z obrázku b). Porovnáním dvojic obrázků a) a e), resp. b) a d) vidíme, že výsledky musely vyjít stejně. Upozornění na častou chybu: Někteří studenti mívají problémy s pravděpodobnostmi nerovností typu a < U < b (viz část c)). Občas má někdo tendenci takovouto pravděpodobnost začít počítat např. jako P(0,35 < U < 1,67) = P(U < 1,67) + P(U > 0,35) = · · · (toto je špatně) nebo dělá jiné nešťastné pokusy. Máte-li k tomuto sklony, zkuste si nakreslit příslušný obrázek a uvědomit si, jaké obsahy by se zde sčítaly – výsledek by vyšel větší než 1, což u pravděpodobnosti nelze. Jiná častá chyba: Při opravování písemek se nezřídka setkáváme se zcela nesmyslnými zápisy (i když konečný výsledek je pak třeba numericky dobře), jako např. P(1 < U < 2) = Φ(1) < P(U) < Φ(2) = · · · Toto je úplně špatně!!! Je-li někdo schopen napsat takovouto věc, znamená to, že se naprosto nezorientoval v základních pojmech a snaží se jen zoufale napodobit jakýsi postup, kterému vůbec nerozumí. Marně se pak nešťastný student brání, že „to přece měl dobře, jenom to špatně zapsal . . . Příklad 8.2. Najděte hodnotu u, pro kterou platí a) P(U < u) = 0,9 b) P(U > u) = 0,05 c) P(U > u) = 0,8 d) P(−u < U < u) = 0,9 Řešení. Pro názornost si můžeme nejprve prohlédnout obrázky 8.2. a) Máme najít u, pro které je P(U < u) = 0,9. Protože P(U < u) je přímo Φ(u), znamená to, že hledáme u, pro které platí Φ(u) = 0,9. Pohledem do tabulky zjistíme (příslušný výřez viz vpravo), že u . = 1,29. u Φ(u) ... ... 1,29 0,9014747 ... ... 106 Normální rozdělení a) 0,9 d d d d d d‚ u b) 0,05         © u c) 0,8          © u d) 0,9 0,050,05         ©          © t t t tt” u−u Obr. 8.2: K příkladu 8.2 Upozornění na častou chybu: Občas někteří studenti vypočítají omylem Φ(0,9) a vyhlásí, že u . = 0,816. Pozor, Φ(0,9) nás teď vůbec nezajímá! Musíme najít to u, pro které je Φ(u) rovno 0,9 - viz výše uvedená část tabulky. b) Zadanou pravděpodobnost vyjádříme pomocí funkce Φ: P(U > u) = 1 − P(U < u) = 1 − Φ(u) Odtud máme 1 − Φ(u) = 0,05 ⇒ Φ(u) = 0,95 ⇒ u . = 1,65. c) Budeme postupovat obdobně jako v části b). Opět je zadaná pravděpodobnost, že U je větší než u. Musí proto platit 1 − Φ(u) = 0,8 ⇒ Φ(u) = 0,2. Nyní může nastat mírný problém – hodnotu u, pro kterou by bylo Φ(u) = 0,2, v tabulce přímo nenajdeme. Je zřejmé, že u bude záporné, využijeme proto vztahu mezi Φ(u) a Φ(−u) (s tím, že −u je teď kladné): 1 − Φ(−u) = 0,2 ⇒ Φ(−u) = 0,8 ⇒ −u . = 0,85 ⇒ u . = −0,85. Příklad jsme mohli řešit i tak, že bychom si představili, že by se obrázek 8.2 c) otočil kolem osy y – vybarvená plocha by pak udávala P(U < −u) (−u je opačná hodnota k hledanému zápornému u) a přímo bychom tak dospěli k rovnici Φ(−u) = 0,8. d) Zde máme dvě možnosti: 8.1 Základní pojmy a řešené příklady 107 Můžeme vyjádřit zadanou pravděpodobnost pomocí Φ, P(−u < U < u) = Φ(u) − Φ(−u) = Φ(u) − (1 − Φ(u)) = 2Φ(u) − 1, a dosadit tento výraz do zadané rovnice P(−u < U < u) = 0,9: 2Φ(u) − 1 = 0,9 ⇒ 2Φ(u) = 1,9 ⇒ Φ(u) = 0,95 ⇒ u . = 1,65. Jiná možnost je uvědomit si, že má-li obsah šedě vybarvené plochy na obrázku 8.2 d) být roven 0,9, znamená to, že oba dva přečnívající kousky (vlevo a vpravo) mají dohromady obsah 0,1, a tím pádem každý z nich musí mít obsah 0,05. Hledáme proto u, pro které by platilo P(U > u) = 0,05, což je ovšem úloha, kterou jsme už vyřešili v části b). Srovnejte též obrázky 8.2 b) a d), z nich je přímo vidět, že výsledky těchto dvou příkladů musí být stejné. Příklad 8.3. Výsledek měření proudu je náhodná veličina X s normálním rozdělením se střední hodnotou µ = 10 mA a rozptylem σ2 = 4 (mA)2 . Vypočtěte pravděpodobnost, že bude naměřeno a) méně než 13 mA b) více než 9 mA c) méně než 12 mA, ale více než 5 mA Řešení. Podle zadání je X ∼ N(10, 4). Abychom mohli vypočítat požadované pravděpodobnosti, musíme náhodnou veličinu X převést na U. Obecně platí U = X − µ σ . Ze zadání známe nikoli přímo σ, ale σ2 . Snadno vypočteme, že σ = √ 4 = 2 mA. Vztah mezi X a U je tedy U = X − 10 2 . Funkční závislost náhodné veličiny U na náhodné veličině X je znázorněna na obrázku 8.3. Nyní přistupme k výpočtu jednotlivých pravděpodobností. a) Máme vypočítat P(X < 13). Z obrázku 8.3 vidíme, že hodnotám X menším než 13 odpovídají hodnoty U menší než 13−10 2 = 1,5. Proto platí P(X < 13) = P(U < 13−10 2 ) = P(U < 1,5) = Φ(1,5) . = 0,933. b) Počítáme P(X > 9). Podobně jako v části a) si můžeme uvědomit, že hodnotám X větším než 9 odpovídají hodnoty U větší než 9−10 2 = −0,5. Proto P(X > 9) = P(U > 9−10 2 ) = P(U > −0,5) = 1 − P(U < −0,5) = 1 − Φ(−0,5) = = 1 − (1 − Φ(0,5)) = Φ(0,5) . = 0,691. c) Meze pro U určíme podobně jako v předchozích částech a pak už můžeme počítat pomocí Φ: P(5 < X < 12) = P(5−10 2 < U < 12−10 2 ) = P(−2,5 < U < 1) = Φ(1) − Φ(−2,5) = = Φ(1) − (1 − Φ(2,5)) = Φ(1) + Φ(2,5) − 1 . = 0,841 + 0,994 − 1 = 0,835. Upozornění na častou chybu: Ve vztahu mezi náhodnými veličinami X a U se ve jmenovateli zlomku vyskytuje σ, tj. směrodatná odchylka, zatímco v zadáních příkladů bývá často uveden rozptyl neboli σ2 . Musíme si proto vždy pečlivě přečíst zadání, a v případě, že je zadán rozptyl, jej odmocnit (a nic neodmocňovat, je-li zadána přímo směrodatná odchylka). 108 Normální rozdělení 1,5 2 1 −1 −2 U X13 U = X−10 2 Obr. 8.3: K příkladu 8.3 – převod mezi hranicemi pro X a U Příklad 8.4. Měřicí přístroj je zatížen jednak systematickou chybou 1 a dále chybou náhodnou. Víme, že náhodné chyby mají normální rozdělení se směrodatnou odchylkou σ = 0,3. a) Nad jakou hodnotu se chyba dostane jen s pravděpodobností 0,01? b) Pod jakou hodnotou bude chyba s pravděpodobností 0,02? c) V jakých mezích (souměrných kolem 1) se dá očekávat chyba při 75 % měření? Řešení. Celková chyba měření – označme ji X – má normální rozdělení se střední hodnotou µ = 1 a směrodatnou odchylkou σ = 0,3. Tedy X ∼ N(1; 0,32 ), a proto U = X − 1 0,3 . a) Hledáme x, pro které by platilo P(X > x) = 0,01. Stejně jako v předchozím příkladu náhodnou veličinu X převedeme na náhodnou veličinu U: P(X > x) = 0,01 ⇒ P(U > x−1 0,3 ) = 0,01. Označme u = x−1 0,3 . Pak P(U > u) = 0,01 ⇒ 1 − Φ(u) = 0,01 ⇒ Φ(u) = 0,99 ⇒ u . = 2,33. Nyní dopočítáme hledanou hodnotu x: x − 1 0,3 = 2,33 ⇒ x = 2,33 · 0,3 + 1 = 1,699. Dá se tedy čekat, že hodnotu 1,699 přesáhne chyba jen při 1 % měření. b) Budeme postupovat obdobně jako v části a). Najdeme příslušnou hraniční hodnotu u a pak pomocí ní ze vztahu u = x−1 0,3 vypočítáme mezní hodnotu x, pro kterou platí P(X < x) = 0,02: P(U < u) = 0,02 ⇒ Φ(u) = 0,02. 8.1 Základní pojmy a řešené příklady 109 Odtud vidíme (protože 0,02 < 0,5), že u bude záporné. Použijeme proto příslušný vztah: 1 − Φ(−u) = 0,02 ⇒ Φ(−u) = 0,98 ⇒ −u . = 2,06 ⇒ u . = −2,06. Zbývá vypočítat x: x − 1 0,3 = −2,06 ⇒ x = −2,06 · 0,3 + 1 = 0,382. c) Zde hledáme dvě hraniční hodnoty, označme je x1 a x2, pro které platí P(x1 < X < x2) = 0,75. Navíc víme, že tyto hodnoty mají být souměrné kolem 1, tzn. že x1 = 1 − d a x2 = 1 + d, kde d > 0 je nějaká konstanta, kterou zatím neznáme. Mohli bychom také říct, že hledáme právě toto d, a předchozí rovnici přepsat jako P(−d < X − 1 < d) = 0,75. Lze tušit (viz obrázek 8.4), že při přepočítávání mezních hodnot x1 a x2 na mezní hodnoty pro U dostaneme čísla navzájem opačná. Pro x1 to bude u1 = x1 − 1 0,3 = 1 − d − 1 0,3 = − d 0,3 , zatímco pro x2 je to u2 = x2 − 1 0,3 = 1 + d − 1 0,3 = d 0,3 . Opravdu je tedy u1 = −u2. Pro zjednodušení přeznačíme u2 na u a u1 je pak rovno −u. Má platit, že P(−u < U < u) = 0,75, viz obrázek 8.4. Podobný úkol jsme řešili v příkladu 8.2, části d), kde jsme ukázali, že P(−u < U < u) = 2Φ(u) − 1. Využijeme-li tohoto faktu, dostáváme: 2Φ(u) − 1 = 0,75 ⇒ Φ(u) = 0,875 ⇒ u . = 1,16. Nyní můžeme dopočítat x1 a x2 (případně bychom mohli napřed spočítat d, a x1 a x2 pak pomocí něj): x1−1 0,3 = −1,16 ⇒ x1 = −1,16 · 0,3 + 1 = 0,652 x2−1 0,3 = 1,16 ⇒ x2 = 1,16 · 0,3 + 1 = 1,348. Dá se tedy čekat, že v 75 % měření bude chyba mezi 0,652 a 1,348. Pro kontrolu bychom nyní mohli u každé z částí a), b), c) vypočítat zpětně příslušnou pravděpodobnost. Např. u části c) bychom počítali P(0,652 < X < 1,348) a mělo by vyjít přibližně 0,75 (zcela přesně by to nebylo, protože při předchozím výpočtu jsme používali zaokrouhlené hodnoty). 110 Normální rozdělení ux y y −u u1 1 − d 1 + d Q k 0,75       C d d d d d d d d‚ Obr. 8.4: K příkladu 8.4, část c) 8.2 Příklady pro samostatnou práci Příklad 8.5. Vypočtěte pravděpodobnosti: a) P(U > 1,23) c) P(U > −6/7) e) P(1 < U < 2) g) P(|U| < 1,5) b) P(U < 0,45) d) P(U < −9/8) f) P(−3 < U < −2) h) P(|U| > 2) Výsledek: (Vše zaokrouhleno na 3 místa) a) 0,109; b) 0,674; c) 0,804; d) 0,130; e) 0,136; f) 0,021; g) 0,866; h) 0,046 Příklad 8.6. Aniž byste uvedené pravděpodobnosti počítali, doplňte místo znaku jeden ze znaků <, > nebo =, podle toho, v jakém vztahu tyto pravděpodobnosti jsou. a) P(U < 0,8) P(U < 0,9) e) P(0,9 < U < 1,1) P(1,9 < U < 2,1) b) P(U < 0,7) P(U > 0,7) f) P(1 < U < 2) P(U < 2) + P(U > 1) c) P(U > −2) P(U < 2) g) P(1 < U < 2) 1 − P(U < 1) − P(U > 2) d) P(U < −3) P(U < 3) h) 2P(U > 1) 1 − P(−1 < U < 1) Výsledek: a) <; b) >; c) =; d) <; e) >; f) <; g) =; h) = Příklad 8.7. Najděte hodnotu u, pro kterou platí a) P(U > u) = 0,25 c) P(U < u) = 0,99 e) P(0 < U < u) = 0,35 b) P(U < u) = 0,1 d) P(−u < U < u) = 0,99 f) P(1 < U < u) = 0,2 Výsledek: a) 0,68; b) -1,29; c) 2,33; d) 2,58; e) 1,04; f) nemá řešení Příklad 8.8. Náhodná veličina X má normální rozdělení se střední hodnotou µ = 5 a směrodatnou odchylkou σ = 4. Vypočtěte následující pravděpodobnosti: 8.2 Příklady pro samostatnou práci 111 a) P(X < 11) c) P(3 < X < 7) e) P(µ − σ < X < µ + 2σ) b) P(X > 0) d) P(0 < X < µ) f) P(|X − µ| < 0,4) Výsledek: a) 0,933; b) 0,894; c) 0,383; d) 0,394; e) 0,819; f) 0,080 Příklad 8.9. Náhodná veličina X má normální rozdělení, X ∼ N(7, 9). Určete hodnotu x, pro kterou platí: a) P(X > x) = 0,5 c) P(X > x) = 0,95 (pokuste se využít výsledku b)) b) P(X < x) = 0,95 d) P(0 < X < x) = 0,95 e) P(−x < X − 7 < x) = 0,95 Výsledek: a) 7; b) 11,95; c) 2,05; d) 12,28; e) 5,88 Příklad 8.10. Náhodná veličina X má normální rozdělení se střední hodnotou µ a rozptylem σ2 . Pro určité x platí, že P(X < x) = 0,75. Rozhodněte, jestli by se tato pravděpodobnost zvětšila nebo zmenšila, kdyby a) µ bylo větší, b) σ bylo větší, c) x bylo větší. Výsledek: Pravděpodobnost se a) zmenší; b) zmenší; c) zvětší. Příklad 8.11. Náhodná veličina X má normální rozdělení se střední hodnotou µ a rozptylem σ2 . Pro α = 0,05 je mezní hodnota x, pro kterou platí P(X > x) = α, rovna 1. Které z následujících výroků platí? a) Pro α = 0,01 by mezní hodnota x vyšla menší než 1. b) Pro α = 0,01 by mezní hodnota x vyšla větší než 1. c) Střední hodnota µ je určitě menší než 1. d) Rozptyl σ2 je určitě menší než 1. Výsledek: Platí b) a c). Příklad 8.12. Při kontrole jakosti přebíráme součástku tehdy, jestliže se její rozměr pohybuje v mezích 26–27 mm. Rozměry součástek mají normální rozdělení se střední hodnotou µ = 26,4 mm a směrodatnou odchylkou σ = 0,2 mm. Jaká je pravděpodobnost, že rozměr součástky náhodně vybrané ke kontrole bude v požadovaných mezích? Výsledek: 0,976 Příklad 8.13. Doba, kterou potřebuje buňka jistého typu, aby se rozdělila na dvě buňky, je náhodná veličina s normálním rozdělením se střední hodnotou 1 hodina a směrodatnou odchylkou 5 minut. a) Jaká je pravděpodobnost, že se buňka rozdělí dříve než za 45 minut? b) Jaká je pravděpodobnost, že buňce bude dělení trvat déle než 65 minut? c) Do jaké doby se rozdělí 99% buněk? Výsledek: a) 0,001; b) 0,159; c) 71,65 min Příklad 8.14. V konzervárně plní sklenice s džemem. Hmotnost obsahu naplněné sklenice má normální rozdělení se střední hodnotou 250 g a směrodatnou odchylkou 5 g. Produkt je v normě, je-li jeho hmotnost v rozmezí 250 ± 8 g. 112 Normální rozdělení a) Jaká je pravděpodobnost, že náhodně vybraná sklenice je v normě? b) V jakém rozmezí (souměrném kolem střední hodnoty) je hmotnost 95% sklenic? c) Jestliže náhodně vybereme čtyři sklenice, jaká je pravděpodobnost, že všechny jsou v normě? d) Jaká je pravděpodobnost, že aspoň jedna z náhodně vybraných čtyř sklenic není v normě? Výsledek: a) 0,990; b) 240,2–259,8 g; c) 0, 9904 . = 0,961; d) 1 − 0, 9904 . = 0,039 Příklad 8.15. Reakční doba řidiče po spatření překážky je náhodná veličina s normálním rozdělením se střední hodnotou µ = 0,4 sekundy a směrodatnou odchylkou σ = 0,05 sekundy. a) Jaká je pravděpodobnost, že řidič zareaguje později než za 0,5 s? b) Jaká je pravděpodobnost, že reakční doba bude v intervalu (0,4; 0,5)? c) Jakou hodnotu reakční doba překročí v 90 % případů? Výsledek: a) 0,023; b) 0,477; c) 0,336 sekundy Příklad 8.16. Životnost laseru má normální rozdělení se střední hodnotou µ = 7000 hodin a směrodatnou odchylkou σ = 600 hodin. a) Jaká je pravděpodobnost, že laser selže dříve než za 6000 hodin? b) Do jaké doby selže 95 % laserů? c) V určitém zařízení pracují nezávisle na sobě 3 lasery. Jaká je pravděpodobnost, že po 7000 hodinách bude zařízení ještě fungovat? Výsledek: a) 0,048; b) do 7987 hodin; b) 0,125 Příklad 8.17. Hmotnost páru speciálních běžeckých bot v určité velikosti má normální rozdělení se střední hodnotou µ = 340 gramů a směrodatnou odchylkou σ = 15 gramů. a) Jaká je pravděpodobnost, že hmotnost bot překročí 370 g? b) Jaká by musela být směrodatná odchylka σ, aby výrobce mohl tvrdit, že 99,9 % párů bot nepřekročí hmotnost 370 g? c) Kdyby σ bylo 15 g, jaká by musela být střední hodnota µ, aby výrobce mohl tvrdit, že 99,9 % párů bot nepřekročí hmotnost 370 g? Výsledek: a) 0,023; b) přibližně 9,375 g; c) přibližně 322 g Příklad 8.18. * Výpočtem příslušných integrálů dokažte, že pro náhodnou veličinu s hustotou f(x) = 1√ 2π σ e−(x−µ)2/(2σ) pro x ∈ (−∞, ∞) je střední hodnota rovna µ a rozptyl roven σ2 . (Návod: využijte toho, že ∞ −∞ f(x)dx = 1.) 8.3 Aproximace binomického rozdělení normálním rozdělením Připomeňme, že náhodná veličina X má binomické rozdělení pravděpodobnosti s parametry n a p, píšeme X ∼ Bi(n, p), jestliže X udává počet úspěchů v n nezávislých pokusech, 8.3 Aproximace binomického rozdělení normálním rozdělením 113 přičemž v každém jednotlivém pokusu úspěch nastává s pravděpodobností p (viz kapitola 6). Zopakujme též, že pro takovouto náhodnou veličinu je střední hodnota EX = np a rozptyl DX = np(1−p). Protože pro velký počet pokusů n se výpočty pravděpodobností technicky komplikují, je výhodné použít místo binomického rozdělení pravděpodobnosti rozdělení normální. Aproximace binomického rozdělení normálním Jestliže náhodná veličina X má binomické rozdělení, X ∼ Bi(n, p), n je velké a p není příliš blízké nule ani jedničce, pak se uvedené rozdělení dá přibližně nahradit normálním rozdělením se stejnou střední hodnotou a rozptylem, jako mělo původní binomické rozdělení. Neboli X ∼ Bi(n, p) ⇒ přibližně X ∼ N(µ, σ2 ), µ = np, σ2 = np(1 − p). Pro výpočet pravděpodobnosti pak platí P(x1 < X ≤ x2) . = P( x1 − µ σ < U ≤ x2 − µ σ ) = Φ( x2 − µ σ ) − Φ( x1 − µ σ ). Formulace „n je velké a p není příliš blízké nule ani jedničce je ovšem dosti vágní. V literatuře lze nalézt např. podmínku, že aproximace je dobrá, je-li np > 5 a současně n(1 − p) > 5. Aproximace s korekcí Aproximaci binomického rozdělení normálním lze vylepšit pomocí tzv. korekce (viz příklad 8.20 a obrázky 8.5). Jestliže x1 a x2 jsou celá čísla, pravděpodobnost P(x1 ≤ X ≤ x2) počítáme jako P(x1 ≤ X ≤ x2) = P(x1 − 0,5 < X < x2 + 0,5) . = . = P (x1 − 0,5) − µ σ < U < (x2 + 0,5) − µ σ = = Φ (x2 + 0,5) − µ σ − Φ (x1 − 0,5) − µ σ . Pozor, zde na typu nerovností záleží, protože X je diskrétní náhodná veličina! V případě P(x1 < X < x2) by byl výsledek jiný. Příklad 8.19. Pravděpodobnost narození chlapce je 0,5151 . Jaká je pravděpodobnost, že 1 Chlapců se opravdu rodí více než děvčat, poměr je údajně zhruba 106:100, což dává právě onu pravděpodobnost 0,515. 114 Normální rozdělení a) mezi 10 novorozenci bude více děvčat než chlapců, b) mezi 10 000 novorozenci bude více děvčat než chlapců, c) mezi 100 000 novorozenci bude relativní četnost chlapců v mezích od 0,513 do 0,515? Řešení. a) Tato část má sloužit hlavně pro osvěžení binomického rozdělení. Zde je počet „pokusů (tj. narozených dětí) vcelku malý, takže pravděpodobnost spočítáme přesně. Má-li být mezi 10 novorozenci více děvčat než chlapců, musí být děvčat alespoň 6, tj. může jich být 6, 7, 8, 9, nebo 10. Označíme-li X počet narozených děvčat, pak X má binomické rozdělení s parametry n = 10 a p = 1 − 0,515 = 0,485 (počítáme děvčata). Požadovaná pravděpodobnost je P(X ≥ 6) = p(6) + p(7) + p(8) + p(9) + p(10) = 10 6 · 0,4856 · 0,5154 + + 10 7 · 0,4857 · 0,5153 + 10 8 · 0,4858 · 0,5152 + 10 · 0,4859 · 0,515 + 0,48510 . = 0,341. b) Označme X počet děvčat mezi 10 000 novorozenci. V tomto případě X ∼ Bi(10 000; 0,485). Děvčat má být nadpoloviční většina, a proto jich musí být alespoň 5 001. Kdybychom tuto část řešili stejně jako a), zadaná pravděpodobnost by se počítala jako P(X ≥ 5 001) = 10 000 k=5 001 p(k) = 10 000 5 001 · 0,4855 001 · 0,5154 999 + · · · + 0,48510 000 , což by bylo velmi pracné. Příklad proto vyřešíme pomocí aproximace normálním rozdělením. Nejprve vypočteme střední hodnotu a rozptyl náhodné veličiny X: EX = 10 000 · 0,485 = 4 850, DX = 10 000 · 0,485 · (1 − 0,485) = 2 497,75. Můžeme říct, že přibližně X ∼ N(µ = 4 850; σ2 = 2 497,75). Další výpočet už bude podobný jako např. v příkladu 8.3. Náhodnou veličinu X ztransformujeme (pozor, rozptyl DX = σ2 musíme opět odmocnit, abychom dostali σ): U = X − µ σ = X − 4 850 √ 2 497,75 a vypočteme pravděpodobnost způsobem obvyklým pro normální rozdělení: P(X ≥ 5 001) = P U ≥ 5 001 − 4 850 √ 2 497,75 . = P(U ≥ 3) = 1 − P(U < 3) = 1 − Φ(3) . = 1 − 0,99865 = 0,00135. Pro srovnání, přesným výpočtem pomocí binomického rozdělení by vyšlo 0,00130 – kvůli tomuto porovnání jsme uvedli tolik desetinných míst. 8.3 Aproximace binomického rozdělení normálním rozdělením 115 c) Tentokrát označíme X počet chlapců mezi 100 000 narozenými dětmi. Pro náhodnou veličinu X platí, že X ∼ Bi(100 000; 0,515), a tedy EX = 100 000 · 0,515 = 51 500, DX = 100 000 · 0,515 · 0,485 = 24 977,5 Je-li relativní četnost (tj. poměr počtu narozených chlapců ku počtu všech dětí) mezi 0,513 a 0,515, znamená to, že chlapců se narodilo 51 300 až 51 500. Pro výpočet pravděpodobnosti opět použijeme aproximaci normálním rozdělením. Přibližně je X ∼ N(51 500; 24 977,5), a tedy U = X − 51 500 √ 24 977,5 . Zadaná pravděpodobnost je P(51 300 ≤ X ≤ 51 500) = P 51 300 − 51 500 √ 24 977,5 ≤ U ≤ 51 500 − 51 500 √ 24 977,5 . = . = P(−1,27 ≤ U ≤ 0) = Φ(0)−Φ(−1,27) = Φ(0)−(1−Φ(1,27)) . = 0,5−(1−0,898) = 0,398. (Přesným výpočtem s binomickým rozdělením by vyšlo 0,399.) Příklad 8.20. V učebně je 25 počítačů. Každý z nich může být mimo provoz s pravděpodobností 0,1. Jaká je pravděpodobnost, že mimo provoz budou 2 až 3 počítače? Úlohu řešte a) přesně, b) pomocí normálního rozdělení, c) pomocí normálního rozdělení s korekcí. Porovnejte výsledky příkladů b) a c) s výsledkem a). Řešení. Označme X počet pokažených počítačů v učebně. Platí, že X ∼ Bi(25; 0,1). a) Výsledek vypočteme jako součet pravděpodobností, že pokažené počítače budou právě dva a právě tři: P(2 ≤ X ≤ 3) = p(2) + p(3) = 25 2 0,12 · 0,923 + 25 3 0,13 · 0,922 . = 0,492. b) Vypočteme střední hodnotu a rozptyl náhodné veličiny X: EX = µ = 25 · 0,1 = 2,5, DX = σ2 = 25 · 0,1 · 0,9 = 2,25 ⇒ σ = 2,25 = 1,5. Nyní pravděpodobnost vypočteme pomocí normálního rozdělení. Transformační vztah mezi X a U je U = X−2,5 1,5 . P(2 ≤ X ≤ 3) . = P 2 − 2,5 1,5 ≤ U ≤ 3 − 2,5 1,5 . = P(−0,33 ≤ U ≤ 0,33) = = Φ(0,33)−Φ(−0,33) = Φ(0,33)−(1−Φ(0,33)) = 2Φ(0,33)−1 . = 2·0,629−1 = 0,258. Vidíme, že výsledek se od přesné hodnoty, získané v části a), značně liší. 116 Normální rozdělení c) Použijeme korekci: P(2 ≤ X ≤ 3) = P(1,5 < X < 3,5) . = P 1,5 − 2,5 1,5 ≤ U ≤ 3,5 − 2,5 1,5 . = . = P(−0,67 ≤ U ≤ 0,67) = Φ(0,67) − Φ(−0,67) = 2Φ(0,67) − 1 . = 2 · 0,749 − 1 = 0,498. Tentokrát je výsledek mnohem přesnější, liší se až na třetím desetinném místě. Jako ilustrace k tomuto příkladu slouží obrázek 8.5. Na obrázku vlevo nahoře je histogram pravděpodobností binomického rozdělení. Pravděpodobnost vypočtená v části a) je reprezentována obsahy dvou vybarvených obdélníků. Oba tyto obdélníky mají šířku 1, výšky jsou rovny p(2), resp. p(3). Součet obsahů těchto obdélníku je proto právě p(2) + p(3). Na obrázku vpravo nahoře je pak histogram spolu s grafem hustoty normálního rozdělení se stejnou střední hodnotou a rozptylem, jako má původní binomické rozdělení. Na obrázku vlevo dole vyšrafovaná plocha pod grafem hustoty určuje pravděpodobnost vypočtenou v části b), obrázek vpravo dole se vztahuje k části c). Odtud vidíme, proč je výsledek b) špatný, zatímco výsledek c) se hodně blíží přesné hodnotě. Kdybychom podobný obrázek nakreslili k příkladu 8.19 (příklad s narozenými dětmi) b) nebo c), jednotlivé sloupce histogramu by měly velmi malou výšku (např. pro část b) předchozího příkladu je p(5001) . = 8 · 10−5 , takže korekce by se příliš neprojevila. a) 1 2 3 4 5 6 7 x y p(2) p(3) 1 2 3 4 5 6 7 x y y = f(x) b) 1 2 3 4 5 6 7 x y y = f(x) c) 1 2 3 4 5 6 7 x y y = f(x) Obr. 8.5: K příkladu 8.20 Příklad 8.21. Pod jakou hodnotou zůstane počet šestek při 1000 hodech kostkou s pravděpodobností 0,9? 8.4 Příklady pro samostatnou práci 117 Řešení. Označme X počet šestek při 1000 hodech kostkou. Platí X ∼ Bi(1000, 1/6). Pro začátek poznamenejme, že zadání není formulováno úplně přesně. Najít x, pro které by přesně platilo P(X < x) = 0,9, se u diskrétní náhodné veličiny nemusí podařit. Ve skutečnosti se budeme snažit najít nejmenší celé číslo x, pro které bude platit P(X < < x) ≥ 0,9. (Tj. s hodnotou x, pro kterou by platilo P(X < x) = 0,85, bychom nebyli spokojeni, zatímco s x, pro které je P(X < x) = 0,95, už ano). Kdybychom měli hraniční hodnotu hledat pomocí binomického rozdělení, bylo by to značně pracné. Hledali bychom první celé číslo x, pro které by platilo P(X < x) = x−1 k=0 1000 k 1 6 k 5 6 1000−k ≥ 0,9. Využijeme proto aproximaci binomického rozdělení normálním: EX = µ = 1000 · 1 6 . = 166,67, DX = σ2 = 1000 · 1 6 · 5 6 . = 138,89. Přibližně X ∼ N(166,67; 138,89), a tedy U = X−166,67√ 138,89 . Hledáme x, pro které platí P(X < < x) = 0,9. Budeme postupovat obdobně jako v příkladu 8.4. Nejprve najdeme hraniční hodnotu pro náhodnou veličinu U: P(U < u) = 0,9 ⇒ Φ(u) = 0,9 ⇒ . = 1,29. Odtud vypočteme x: x = 1,29 · 138,89 + 166,67 . = 182. Protože x má být hranice pro počet šestek, hodnotu jsme zaokrouhlili na celé číslo. Platí tedy, že s pravděpodobností zhruba 90% bude při 1000 hodech kostkou počet šestek menší než 182. Protože jsme si výpočet zjednodušili použitím normálního rozdělení, není zaručeno, že P(X < 182) už opravdu přesáhne 0,9. Při přesném výpočtu pomocí binomického rozdělení bychom zjistili, že P(X < 182) je ve skutečnosti jen 0,895 a že hodnota 0,9 je dosažena až pro 183. S takovouto chybou se však dokážeme smířit, uvážíme-li, jak pracný by byl přesný výpočet. 8.4 Příklady pro samostatnou práci Příklad 8.22. Stokrát hodíme kostkou. Jaká je pravděpodobnost, že šestka padne alespoň 20-krát? Vypočtěte a) pomocí normálního rozdělení, b) pomocí normálního rozdělení s korekcí, c) přesně (použijte počítač). Výsledek: a) 0,187 ; b) 0,224 ; c) 0,220 118 Normální rozdělení Příklad 8.23. 250 soustruhů pracuje nezávisle na sobě. Každý z nich je v provozu 80 % z celkové pracovní doby. Jaká je pravděpodobnost, že v náhodně vybraném okamžiku je v provozu a) 190 až 220 soustruhů, b) 74 až 86 procent soustruhů? Vypočtěte pomocí normálního rozdělení. Výsledek: a) 0,942 (s korekcí 0,951); b) 0,982 (s korekcí 0,986) Příklad 8.24. Pravděpodobnost, že se zasazený strom ujme, je 0,85. Jaká je pravděpodobnost, že z 500 zasazených stromů se jich ujme a) aspoň 420, b) nanejvýš 440? Vypočtěte pomocí normálního rozdělení. Výsledek: a) 0,736 (s korekcí 0,755) ; b) 0,970 (s korekcí 0,974) Příklad 8.25. * Pravděpodobnost, že se zasazený strom ujme, je 0,85. Kolik stromů musíme vysadit, aby jich s pravděpodobností 90 % přežilo aspoň 100? Vypočtěte pomocí normálního rozdělení. Výsledek: 124 Příklad 8.26. 12 000-krát hodíme mincí. Jaká je pravděpodobnost, že relativní četnost líců bude 0,5015? Vypočtěte pomocí normálního rozdělení. Výsledek: 0,008 – počítáno s korekcí. Bez korekce vyjde 0 Příklad 8.27. Podle údajů ze sčítání lidu v roce 1970 bylo zhruba 75 % domácností vybaveno televizorem1 . Náhodně bylo vybráno 400 domácností. a) Jaká je pravděpodobnost, že z vybraných 400 domácností má televizor 290–305? b) Určete, v jakých mezích (souměrných kolem střední hodnoty) bude počet domácností s televizorem (ze 400 vybraných) s pravděpodobností 95 %. Výsledek: a) 0,594 (s korekcí 0,625); b) 283 až 317 Příklad 8.28. Lojza vyplňuje test IQ, který se skládá z 50 otázek. U každé otázky je 5 možností pro odpověď, správná je vždy právě jedna možnost. Lojza vše vyplní náhodně. a) Jaká je pravděpodobnost, že správně odpoví právě na 10 otázek? (Vypočtěte pomocí binomického rozdělení a pomocí normálního rozdělení s korekcí.) b) Nad jakou hranici počtu správných odpovědí se Lojza dostane jen s pravděpodobností 0,01? Výsledek: a) přesně, tj. pomocí Bi: 0,140; pomocí N s korekcí: 0,143 (bez korekce by vyšlo 0); b) 17 1 Opravdu je to tak, viz www stránky Českého statistického úřadu. 8.4 Příklady pro samostatnou práci 119 Příklad 8.29. Každý ze 300 přístrojů se skládá ze tří součástek, které se mohou nezávisle na sobě pokazit. Když se některá součástka pokazí, přístroj přestane pracovat. Pravděpodobnost, že se během dne pokazí první součástka, je 0,1. Pro druhou součástku je pravděpodobnost závady 0,05 a pro třetí 0,15. a) Jaká je pravděpodobnost, že se během dne pokazí méně než 100 přístrojů? b) Pod jakou hranicí zůstane počet pokažených přístrojů s pravděpodobností 0,9? Výsledek: Mezivýsledek: pravděpodobnost poruchy je pro každý jednotlivý přístroj 0,27325. a) 0,986 (s korekcí 0,988); b) 92 120 Statistické testy 9 Statistické testy 9.1 Základní pojmy a řešené příklady Statistické testy, které probíráme v našem kurzu, slouží k tomu, abychom rozhodli, jestli by určitý parametr mohl být roven určité hodnotě, θ = θ0, nebo jestli okolnosti nasvědčují spíše tomu, že tento parametr bude větší nebo menší než hodnota θ0. Budeme se věnovat dvěma případům: v prvním z nich budeme testovat parametr p binomického rozdělení a ve druhém střední hodnotu µ normálního rozdělení. Existuje ale i řada dalších testů. Obecně se testování provádí v těchto krocích: 1. Vyslovíme nulovou hypotézu H0 a alternativní hypotézu H1. 2. Stanovíme testové kritérium – náhodnou veličinu T, podle které chceme o platnosti nulové hypotézy H0 rozhodnout. 3. Předpokládáme, že platí H0, a najdeme kritický obor W, do kterého testové kritérium T padne jen se zvolenou malou pravděpodobností α. Hodnotu α nazýváme hladinou významnosti testu. Kritický obor W je tedy stanoven tak, aby P(T ∈ W|platí H0) = α, a jeho hranici (hranice) tvoří odpovídající kvantil (kvantily) náhodné veličiny T. Připomeňme, že α-kvantil náhodné veličiny T je to číslo tα, pro které je P(T ≤ tα) = F(tα) = α. 4. Zjistíme hodnotu testového kritéria (zpracujeme výsledek konkrétního pokusu či měření). 5. Jestliže empirická (tj. pokusem získaná) hodnota kritéria leží v kritickém oboru, zamítáme hypotézu H0 ve prospěch alternativní hypotézy H1 – hypotéza H1 byla prokázána. Pokud naměřená hodnota v kritickém oboru neleží, hypotézu H0 nezamítáme a hypotéza H1 se neprokázala. Testy rozlišujeme jednostranné a oboustranné, podle toho, co se snažíme prokázat. 9.1 Základní pojmy a řešené příklady 121 t1−α/2tα/2 obor pˇrijet´ı kritick´y oborkritick´y obor 1 − α ❅ ❅ ❅ ❅ ❅ ❅ ❅ ❅❘ α/2 ◗ ◗ ◗ ◗s α/2 ✑ ✑ ✑ ✑✰ Obr. 9.1: Oboustranný test Jestliže testujeme nulovou hypotézu H0 : θ = θ0 proti alternativní hypotéze H1 : θ = θ0, provádíme oboustranný test. Kritický obor je pak tvaru (viz obrázek 9.1) W = tmin, tα/2 ∪ t1−α/2, tmax . Jestliže je alternativní hypotéza tvaru H1 : θ > θ0, provádíme jednostranný, a to pravostranný test. Kritický obor je pak tvaru (viz obrázek 9.2) W = (t1−α, tmax) . Jestliže je alternativní hypotéza tvaru H1 : θ < θ0, provádíme jednostranný, a to levostranný test. Kritický obor je pak tvaru (viz obrázek 9.3) W = (tmin, tα) . Výsledek testování může být správný nebo se můžeme dopustit špatného závěru. 122 Statistické testy t1−αobor pˇrijet´ı kritick´y obor 1 − α ❅ ❅ ❅ ❅ ❅ ❅ ❅ ❅❘ α ✑ ✑ ✑ ✑✰ Obr. 9.2: Pravostranný test tα obor pˇrijet´ıkritick´y obor 1 − α ❅ ❅ ❅ ❅ ❅ ❅ ❅ ❅❘ α ◗ ◗ ◗ ◗s Obr. 9.3: Levostranný test Chyba 1. druhu nastane, jestliže nulová hypotéza H0 platí, ale my ji zamítneme. Pravděpodobnost chyby 1. druhu je rovna hladině významnosti testu α, P(H0 zamítneme|H0 platí) = α. Chyba 2. druhu nastane, jestliže nulová hypotéza H0 neplatí (čili platí H1), a přitom H0 není zamítnuta. Pravděpodobnost chyby 2. druhu označíme β. S chybou 2. druhu souvisí tzv. síla testu. Je to pravděpodobnost, že správně zamítneme H0, když platí alternativní hypotéza H1, síla jednostranného testu = P(H0 zamítneme|H0 neplatí) = 1 − β. Místo hledání hranic kritického oboru můžeme pro rozhodnutí, jestli výsledek pokusu v kritickém oboru leží nebo neleží, použít tzv. p-hodnotu. p-hodnota (nezaměňovat s parametrem p binomického rozdělení!) je přesná nebo též pozorovaná hladina významnosti. Udává nejmenší hodnotu hladiny významnosti, na které bychom nulovou hypotézu H0 zamítli. Vypočítáme ji jako pravděpodobnost, že testové kritérium nabude pozorované hodnoty nebo hodnoty extrémnější. Porovnáním s α pak můžeme rozhodnout, jestli pozorovaná hodnota leží nebo neleží v kritickém oboru. Test hypotézy o parametru p binomického rozdělení Již víme, že pro náhodnou veličinu X ∼ Bi(n, p) parametr p udává pravděpodobnost úspěchu v jednom pokusu. Pomocí statistického testu se budeme snažit rozhodnout, jestli by tento parametr mohl být roven určitému p0, nebo zda je prokazatelně vyšší či nižší. 9.1 Základní pojmy a řešené příklady 123 kritick´y obor α t t1−α p = P(T > t) Obr. 9.4: Testování pomocí p-hodnoty, pravostranný test, H0 nezamítáme kritick´y obor α tt1−α p Obr. 9.5: Testování pomocí p-hodnoty, pravostranný test, H0 zamítáme Často se tento test používá v případě, kdy se snažíme rozhodnout, jestli p0·100 % populace má jistou vlastnost V . Náhodně nezávisle na sobě vybereme n objektů. Na základě toho, kolik z nich má vlastnost V , utvoříme závěr ohledně p. Jako testové kritérium můžeme použít náhodnou veličinu X udávající, kolik objektů z vybraných n kusů má vlastnost V . Za předpokladu, že p = p0, platí X ∼ Bi(n, p0). Prakticky se ale spíše využívá výpočet pomocí normované náhodné veličiny U nebo pomocí p-hodnoty. Nulová hypotéza: H0 : p = p0 Testové kritérium je U = X − np0 np0(1 − p0) = X n − p0 p0(1 − p0) · √ n pˇribl. ∼ N(0, 1), (9.1) kde náhodná veličina X udává, kolik objektů z celkového počtu n má vlastnost V . Hodnotu získanou měřením (průzkumem, pokusem) označíme u. • Oboustranný test Alternativní hypotéza H1 : p = p0 Kritický obor: W = −∞, uα/2 ∪ u1−α/2, ∞ = {u: |u| > u1−α/2} Obor přijetí H0: uα/2, u1−α/2 = −u1−α/2, u1−α/2 = {u: |u| ≤ u1−α/2} −u1−α/2 ≤ u ≤ u1−α/2 ⇒ H0 nezamítáme; |u| > u1−α/2 ⇒ H0 zamítáme. • Pravostranný test Alternativní hypotéza H1 : p > p0 Kritický obor: W = (u1−α, ∞) = {u: u > u1−α} Obor přijetí H0: (−∞, u1−α = {u: u ≤ u1−α} u ≤ u1−α ⇒ H0 nezamítáme; u > u1−α ⇒ H0 zamítáme. • Levostranný test Alternativní hypotéza H1 : p < p0 Kritický obor: W = (−∞, uα) = {u: u < uα} Obor přijetí H0: uα, ∞) = {u: u ≥ uα} u ≥ uα ⇒ H0 nezamítáme; u < uα ⇒ H0 zamítáme. 124 Statistické testy Příklad 9.1. Podle expertního předpokladu bude mít o nový výrobek zájem 20 % zákazníků. Ze 400 dotázaných zákazníků projevilo zájem 62 zákazníků. Na hladině významnosti α = 0,05 testujte hypotézu o reálnosti předpokladu, tedy H0 : p = 0,2. Řešení. Předvedeme řešení třemi metodami. Vyberte si, která vám vyhovuje nejlépe, a tu pak používejte. Bohužel se setkáváme s tím, že studenti z nepochopení počítají u zkoušky všemi třemi postupy (navíc často s rozdílnými výsledky) v domnění, že jde o tři postupné kroky výpočtu. Přitom se jedná o tři alternativy, jak lze výpočet provést, a všechny nás musí dovést ke stejnému závěru. V každém případě budeme testovat nulovou hypotézu H0 : p = 0,2 proti alternativní hypotéze H1 : p = 0,2, provádíme tedy oboustranný test. I. metoda: Jako testové kritérium použijeme náhodnou veličinu X, která udává, kolik zákazníků ze 400 dotázaných projevilo zájem o nový výrobek. Při platnosti hypotézy H0 platí X ∼ Bi(400; 0,2), tedy přibližně X ∼ N(80, 64). (9.2) Najdeme hranice x1 a x2, mezi nimiž se X nachází s pravděpodobností 1 − α = 0,95: P(x1 ≤ X ≤ x2) = 0,95 Podobné úkoly už jsme řešili v kapitolách 8.1 a 8.3, a proto výpočet nebudeme podrobně rozepisovat. Jen připomeňme, že při hledání souměrného intervalu musíme najít 0,975kvantil, a nikoli 0,95-kvantil, viz příklad 8.2, část d), kde se totéž řešilo pro interval obsahující 90 % hodnot. x1 = 80 − 1,96 · √ 64 . = 64, x2 = 80 + 1,96 · √ 64 . = 96. To znamená, že při provádění průzkumu mezi 400 lidmi by počet zájemců o nový výrobek měl být téměř vždy (s pravděpodobností 0,95) mezi 64 a 96. My jsme ale zjistili, že zájem má pouze 62 zákazníků, a to je podezřele málo. Odborněji formulovaný závěr je tento: Pokusem získaná hodnota 62 leží v kritickém oboru, protože 62 < 64. Hypotézu H0 zamítáme. Prokázalo se, že zájem zákazníků je menší než 20 %. Tato metoda asi nejlépe vystihuje podstatu věci – hledání mezí přímo pro počet objektů se zkoumanou vlastností a rozhodnutí, jestli výsledek pokusu v těchto mezích leží. V praxi se ale spíše využívá následující metoda, kde se výsledek pokusu normuje, náhodná veličina X se převede na náhodnou veličinu U se standardizovaným normálním rozdělením. II. metoda – pomocí normované hodnoty (postup z rámečku): Opět předpokládáme, že p = 0,2. Pak pro náhodnou veličina X udávající počet zájemců o nový výrobek mezi 400 dotázanými platí (9.2), a tedy U = X − 80 √ 64 = X − 80 8 ∼ N(0, 1). 9.1 Základní pojmy a řešené příklady 125 Interval, v němž je náhodná veličina U s pravděpodobností 1 − α = 0,95, je u0,025; u0,975 . = −1,96; 1,96 . Tento interval je oborem přijetí hypotézy H0. Kritický obor je pak W = (−∞; −1,96) ∪ (1,96; ∞) . V průzkumu projevilo zájem x = 62 zákazníků. Odpovídající normovaná hodnota je u = 62 − 80 8 = −2,25. Tato hodnota náleží do kritického oboru, a proto hypotézu H0 o předpokladu 20%zájmu zamítáme na hladině významnosti α = 0,05. Skutečný zájem bude pravděpodobně menší. III. metoda – pomocí p-hodnoty: Meze kritického oboru mají u oboustranného testu tu vlastnost, že P(X < x1) = α/2, P(X > x2) = α/2. Na chvíli zapomeňme, že už jsme x1, x2 určili v postupu I. O tom, jestli 62 do těchto mezí patří nebo ne, rozhodneme jiným způsobem, aniž bychom x1, x2 znali. Vypočítáme pravděpodobnost, že X nabude hodnoty 62 nebo extrémnější, tzn. v našem případě menší: Protože 62 < µ = 80, je 62 buď menší než x1, nebo je v oboru přijetí. Je vyloučené, že by 62 leželo až za x2. P(X ≤ 62) = P(U < −2,25) = Φ(−2,25) = 1 − Φ(2,25) . = 1 − 0,988 = 0,012. Výsledek menší než α/2 = 0,025 ukazuje, že 62 leží pod spodní hranicí x1 oboru přijetí nulové hypotézy, tj. v kritickém oboru, a H0 zamítáme. Z tohoto výsledku též vidíme, že na hladině významnosti α = 0,01 bychom H0 nezamítli. Pravděpodobnost, kterou jsme právě vypočítali, tj. 0,012, by ale nebyla p-hodnota. V souladu s definicí p-hodnoty coby nejmenší hladiny významnosti, na které bychom H0 zamítli, musíme za p-hodnotu vzít u oboustranného testu dvojnásobek vypočítané pravděpodobnosti, 0,024 – kdybychom oboustranný test prováděli na této hladině významnosti, 62 by vyšlo přesně na dolní hranici oboru přijetí. Jestliže se vám to zdá nějaké zamotané, můžete u oboustranného testu počítat phodnotu algoritimicky takto: p-hodnota = 2P(U > |u|), kde u je normovaná hodnota příslušná pozorované hodnotě. Je-li p-hodnota menší než hladina významnosti α, výsledek pokusu leží v kritickém oboru a H0 zamítáme. Jestliže je větší nebo rovna α, je výsledek pokusu v oboru přijetí a H0 nezamítáme. Příklad 9.2. Výrobce integrovaných obvodů udává, že množství vadných výrobků nepřesahuje 2 %. Při testování 300 náhodně vybraných integrovaných obvodů bylo nalezeno 8 vadných kusů. Na hladině významnosti α = 0,05 testujte, zda je tvrzení výrobce pravdivé. 126 Statistické testy Řešení. Tentokrát provedeme jednostranný test. Testujeme nulovou hypotézu H0 : p = 0,02 proti alternativní hypotéze H1 : p > 0,02. Řešení tentokrát předvedeme pouze metodou z rámečku (v předchozím příkladu označenou II). Ostatní metody si může čtenář zkusit sám, závěr musí být vždy tentýž. Předpokládáme, že platí H0. Pak má náhodná veličina X udávající počet vadných výrobků mezi 300 vybranými binomické rozdělení, X ∼ Bi(300; 0,02), EX = 300 · 0,02 = 6, DX = 300 · 0,02 · 0,98 = 5,88. Protože np i n(1−p) jsou větší než 5, můžeme binomické rozdělení aproximovat normálním. Přibližně tedy X ∼ N(6; 5,88), U = X − 6 √ 5,88 . Normovaná hodnota příslušná pokusem zjistěné hodnotě x = 8 je u = 8 − 6 √ 5,88 . = 0,82. Protože provádíme pravostranný test, kritický obor je tentokrát (u0,95; ∞), viz obrázek 9.2. Z tabulky zjistíme, že u0,95 . = 1,65. Tedy naměřená hodnota 0,82 v kritickém oboru neleží, 0,82 < 1,65, 0,82 /∈ (1,65; ∞) a hypotézu H0 nezamítáme. Na hladině významnosti α = 0,05 se nepodařilo prokázat, že by vadných výrobků bylo více než 2 %, takže tvrzení výrobce může být pravdivé. Příklad 9.3. Určete sílu testu z předchozího příkladu, jestliže ve skutečnosti jsou mezi integrovanými obvody 4 % vadných. Řešení. Síla testu je pravděpodobnost, že zamítnu H0, tj. v našem případě p = 0,02, jestliže ve skutečnosti platí H1, zde p = 0,04. Nejprve zapomeňme na H1 a odpovězme si na otázku: Kdy v testu z příkladu 9.2 zamítnu H0? Jestliže výsledek pokusu leží v kritickém oboru, který byl pro normovanou náhodnou veličinu U interval (1,65; ∞). Původní náhodná veličinu X udávající počet vadných integrovaných obvodů mezi 300 náhodně vybranými má za předpokladu, že p = 0,02, přibližně N(6; 5,88), a kritický obor pro ni je W = (1,65 5,88 + 6; ∞) . = (10, ∞). My nyní vypočítáme pravděpodobnost, že jestliže ve skutečnosti jsou vadných výrobků 4 %, pak počet vadných výrobků mezi 300 náhodně vybranými bude ležet v intervalu (10, ∞). V tomto případě je X ∼ Bi(300; 0,04) neboli přibližně X ∼ N(12; 11,52), 9.2 Příklady pro samostatnou práci 127 a tedy P(X > 10) = P U > 10 − 12 √ 11,52 . = P(U > −0,59) = 1 − Φ(−0,59) = Φ(0,59) . = 0,722. Síla testu je 0,722. Na obrázku 9.6 je síla testu obsah vyšrafované plochy. Jestliˇze plat´ı H0: p = 0,02 Jestliˇze plat´ı H1: p = 0,04 x6 1210 Obr. 9.6: K příkladu 9.3, síla testu 9.2 Příklady pro samostatnou práci Příklad 9.4. Stokrát jsme hodili kostkou, přitom 25-krát padla šestka. Testujte hypotézu H0, že kostka je poctivá, tj. že pravděpodobnost, že na ní padne šestka, je p = 1/6, proti alternativní hypotéze, že p = 1/6 (oboustranný test), a to na hladině významnosti a) α = 0,05 b) α = 0,01. c) Určete nejmenší hodnotu významnosti, na které bychom H0 zamítli (tj. p-hodnotu). Výsledek: a) H0 zamítáme, šestka padá s vyšší pravděpodobností; b) H0 nezamítáme, neprokázalo se, že by šestka padala s jinou pravděpodobností než 1/6; c) 0,026 Lepší, než počítat jen šestky, by bylo zkoumat, jestli všechna čísla na kostce padají se stejnou pravděpodobností. Takový test skutečně lze provést, bohužel však přesahuje rámec našeho kurzu. Příklad 9.5. Ze 200 výrobků vyrobených novou technologií bylo k zmetků. Testujte na hladině významnosti α = 0,01, zda nová technologie změnila zmetkovitost oproti dřívějším dlouhodobě zjištěným 10 % (proveďte oboustranný test), jestliže a) k = 6, b) k = 13, c) k = 25, d) k = 32. Výsledek: Nulovou hypotézu H0, že p = 0,1, a) zamítáme (zmetkovitost se snížila), b), c) nezamítáme (neprokázalo se, že by zmetkovitost byla jiná než 10 %), d) zamítáme 128 Statistické testy (zmetkovitost se zvýšila). Příklad 9.6. Při průzkumu veřejného mínění v souboru 500 dotazovaných respondentů jich 180 vyjádřilo nespokojenost se svou poslední volbou v parlamentních volbách (tj. dnes by volili jinou stranu). Lze na základě tohoto průzkumu tvrdit, že 40 % voličů je nespokojených se svou poslední volbou? Testujte na hladině významnosti α = 0,05. Výsledek: Nulovou hypotézu, že nespokojených je 40 % voličů, nezamítáme. Příklad 9.7. (Souvisí s příkladem 9.6.) Kolik lidí z 500 dotazovaných respondentů by muselo vyjádřit nespokojenost se svou poslední volbou, abychom na hladině významnosti α = 0,05 byli oprávněni tvrdit, že se počet voličů nespokojených se svou poslední volbou významně liší od 40 %? Výsledek: Méně než 179 nebo více než 221. Příklad 9.8. Testovali jsme hypotézu H0 : p = p0 proti H1 : p = p0 na hladině významnosti α = 0,01. Nulovou hypotézu jsme na této hladině významnosti a) zamítli; b) nezamítli. Jak by dopadl tentýž test na hladině významnosti α = 0,05? Výsledek: a) H0 bychom zamítli; b) bez znalosti konkrétních hodnot nelze rozhodnout. Příklad 9.9. Testovali jsme hypotézu H0 : p = p0 proti H1 : p = p0 na hladině významnosti α = 0,05. Nulovou hypotézu jsme na této hladině významnosti a) zamítli; b) nezamítli. Jak by dopadl tentýž test na hladině významnosti α = 0,01? Výsledek: a) Bez znalosti konkrétních hodnot nelze rozhodnout; b) H0 bychom nezamítli. Příklad 9.10. ∗ Vraťme se k testu z příkladů 9.1 a 9.2. Předpokládejme, že čtyřprocentní chybovost obvodů je pro nás nepřijatelná. Kolik obvodů musíme otestovat, aby síla testu z příkladu 9.2 (neboli pravděpodobnost, že na hladině významnosti α = 0,05 správně zamítneme hypotézu o 2 % vadných obvodů, jestliže ve skutečnosti jsou vadná 4 %) byla 90 %? Výsledek: n = 586 9.3 Test hypotézy o střední hodnotě normálního roz- dělení Máme k dispozici n empiricky zjištěných hodnot x1, x2, . . . , xn získaných nezávisle na sobě. Na základě těchto n měření se snažíme rozhodnout, jestli střední hodnota zkoumané náhodné veličiny může být rovna určitému µ0, nebo jestli dosahuje prokazatelně vyšší či nižší hodnoty. 9.3 Test hypotézy o střední hodnotě normálního rozdělení 129 Předpokládejme, že zkoumaná náhodná veličina X má normální rozdělení, X ∼ N(µ, σ2 ), nebo si nejsme jisti, jestli je má, ale máme k dispozici velký počet měření. Pak můžeme počítat s tím, že výběrový průměr X má opět normální rozdělení, X ∼ N µ, σ2 n , tzn. U = X − µ σ2 n = X − µ σ √ n ∼ N(0, 1). Jestliže rozptyl σ2 neznáme, což je v praxi obvyklé, pak použijeme jeho odhad s2 . Náhodná veličina T = X − µ √ S2 √ n, kde S2 = 1 n − 1 n i=1 (X − X)2 , už ale nemá normální rozdělení, nýbrž tzv. Studentovo t-rozdělení s (n − 1) stupni volnosti, T ∼ t(n − 1). Pro velké n se Studentovo rozdělení přibližuje ke standardizovanému normálnímu rozdělení. 130 Statistické testy Test hypotézy o střední hodnotě µ, jestliže rozptyl známe nebo je rozsah výběru velký Nulová hypotéza: H0 : µ = µ0 Testové kritérium je při známém rozptylu σ2 U = X − µ0 √ σ2 · √ n ∼ N(0, 1), (9.3) nebo při neznámém rozptylu a velkém rozsahu výběru U = X − µ0 √ S2 · √ n pˇribl. ∼ N(0, 1). (9.4) Hodnotu získanou pokusem označíme u. • Oboustranný test Alternativní hypotéza H1 : µ = µ0 Kritický obor: W = −∞, uα/2 ∪ u1−α/2, ∞ = {u: |u| > u1−α/2} Obor přijetí H0: uα/2, u1−α/2 = −u1−α/2, u1−α/2 = {u: |u| ≤ u1−α/2} −u1−α/2 ≤ u ≤ u1−α/2 ⇒ H0 nezamítáme; |u| > u1−α/2 ⇒ H0 zamítáme. • Pravostranný test Alternativní hypotéza H1 : µ > µ0 Kritický obor: W = (u1−α, ∞) = {u: u > u1−α} Obor přijetí H0: (−∞, u1−α = {u: u ≤ u1−α} u ≤ u1−α ⇒ H0 nezamítáme; u > u1−α ⇒ H0 zamítáme. • Levostranný test Alternativní hypotéza H1 : µ < µ0 Kritický obor: W = (−∞, uα) = {u: u < uα} Obor přijetí H0: uα, ∞) = {u: u ≥ uα} u ≥ uα ⇒ H0 nezamítáme; u < uα ⇒ H0 zamítáme. Test lze provádět taktéž pomocí p-hodnoty. Příklad 9.11. Výrobce tvrdí, že jím vyrobené žárovky mají životnost v průměru 1 000 hodin. Potřebujeme se ujistit, že tomu tak opravdu je. Otestovali jsme 60 náhodně vybraných žárovek. Jejich průměrná životnost byla x = 998,23 hodin a výběrový rozptyl byl s2 = 11 083,45. Na hladině významnosti α = 0,05 testujte hypotézu H0 : µ = 1 000, a to proti alternativní hypotéze a) H1 : µ = 1 000 (oboustranný test), b) H1 : µ < 1 000 (jednostranný test). Řešení. Určíme normovanou hodnotu odpovídající naměřené hodnotě x = 998,23: u = 998,23 − 1 000 √ 11 083,45 √ 60 . = −0,13 9.4 Příklady pro samostatnou práci 131 a) U oboustranného testu je obor přijetí nulové hypotézy u0,025; u0,975 = −1,96; 1,96 , kritický obor je W = (−∞; −1,96) ∪ (1,96; ∞). Platí −0,13 ∈ −1,96; 1,96 , −0,13 = W, a proto hypotézu H0 nezamítáme na hladině významnosti α = 0,05. Není tedy důvod tvrdit, že by průměrná životnost žárovek byla významně jiná než 1 000 hodin. b) U jednostranného testu je obor přijetí u0,05; ∞) = −1,65; ∞) , kritický obor je W = (−∞; −1,65). Platí −0,13 ∈ (−1,65; ∞ , −0,13 = W, a proto hypotézu H0 nezamítáme na hladině významnosti α = 0,05. Není tedy důvod tvrdit, že by průměrná životnost žárovek byla významně nižší než 1 000 hodin. 9.4 Příklady pro samostatnou práci Příklad 9.12. 40 vzorků nerostu bylo testováno na obsah aktivní látky. Průměrná hodnota byla x = 25,775 promile, výběrový rozptyl je s2 = 10,987. Lze na základě těchto měření tvrdit, že ve zkoumaném nerostu je 25 promile aktivní látky? Proveďte oboustranný test na hladině významnosti α = 0,05. Výsledek: a) Hypotézu H0 : µ = 25 nezamítáme. Příklad 9.13. Ředitel jedné velké kocourkovské továrny láká nové zaměstnance a tvrdí, že průměrný plat v jeho podniku je 1 100 Kk (korun kocourkovských). Náhodně jsme vybrali 50 zaměstnanců a zjistili, že jejich průměrný plat je 1 028,40 Kk a výběrová směrodatná odchylka s je 126,253 Kk. Na hladině významnosti α = 0,01 testujte hypotézu H0, že průměrný plat je skutečně 1 100 Kk. Proveďte oboustranný test. Výsledek: Hypotézu H0 : µ = 1 100 zamítáme, průměrný plat je nižší Příklad 9.14. Na balíčku kořenicí směsi je uvedeno, že obsah soli je průměrně 40 procent. Potravinářská inspekce náhodně vybrala 45 balíčků a otestovala na množství soli. Průměrné množství bylo x = 41,67 procent a výběrová směrodatná odchylka byla s = 3,342. Na hladině významnosti α = 0,05 testujte, zda průměrný obsah soli v kořenicí směsi nepřesahuje 40 procent, proveďte jednostranný test, tj. H1 : µ > 40. Výsledek: Hypotézu H0 : µ = 40 zamítáme, obsah soli je vyšší než 40 %. 132 Statistické testy Příklad 9.15. Střední doba bezporuchové činnosti určitého typu přístrojů by měla být alespoň 1 000 hodin. Přitom z dřívějších měření víme, že směrodatná odchylka doby bezporuchové činnosti je σ = 100 hodin. Z velké skupiny těchto přístroju jsme náhodně vybrali 25 kusů. Průměrná doba jejich bezporuchové činnosti byla 970 hodin. Je tím prokázáno, že celá skupina nevyhovuje požadavku, aby přístroje pracovaly alespoň 1 000 hodin bez poruchy? Proveďte jednostranný test, a to na hladině významnosti a) α = 0,1, b) α = 0,01. Výsledek: a) Hypotézu H0 : µ = 1 000 zamítáme, prokázala se alternativní hypotéza H1 : µ < 1 000. b) Na hladině významnosti 0,01 H0 nezamítáme; na této hladině významnosti se neprokázalo, že by stroje fungovaly významně kratší dobu. Příklad 9.16. Určete nejmenší hladinu významnosti, pro kterou bychom v příkladu 9.15 hypotézu H0 : µ = 1 000 zamítli. Výsledek: 0,067 (jedná se vlastně o p-hodnotu) Příklad 9.17. Jaká by musela být průměrná doba bezporuchové činnosti 25 přístrojů z příkladu 9.15, abychom na hladině významnosti α = 0,01 mohli tvrdit, že µ < 1 000 hodin? Výsledek: Menší než 953,4 hodiny. Příklad 9.18. Testovali jsme hypotézu H0 : µ = µ0 proti H1 : µ = µ0 na hladině významnosti α = 0,05. Na základě x a s2 vypočítaných z n = 50 naměřených hodnot jsme hypotézu H0 a) zamítli; b) nezamítli. Jak by test dopadl, kdyby tytéž hodnoty x a s2 byly získány z většího výběru, např. n = 100? Výsledek: a) H0 bychom zamítli; b) bez znalosti konkrétních hodnot nelze rozhodnout. Příklad 9.19. Testovali jsme hypotézu H0 : µ = µ0 proti H1 : µ = µ0 na hladině významnosti α = 0,05. Na základě x a s2 vypočítaných z n = 100 naměřených hodnot jsme hypotézu H0 a) zamítli; b) nezamítli. Jak by test dopadl, kdyby tytéž hodnoty x a s2 byly získány z menšího výběru, např. n = 50? Výsledek: a) Bez znalosti konkrétních hodnot nelze rozhodnout; b) H0 bychom nezamítli. 133 Tab. 9.1: Hodnoty distribuční funkce Φ(u) - 1.část. u Φ(u) u Φ(u) u Φ(u) u Φ(u) u Φ(u) 0,00 0,5000000 0,30 0,6179114 0,60 0,7257469 0,90 0,8159399 1,20 0,8849303 0,01 0,5039894 0,31 0,6217195 0,61 0,7290691 0,91 0,8185887 1,21 0,8868606 0,02 0,5079783 0,32 0,6255158 0,62 0,7323711 0,92 0,8212136 1,22 0,8887676 0,03 0,5119665 0,33 0,6293000 0,63 0,7356527 0,93 0,8238145 1,23 0,8906514 0,04 0,5159534 0,34 0,6330717 0,64 0,7389137 0,94 0,8263912 1,24 0,8925123 0,05 0,5199388 0,35 0,6368307 0,65 0,7421539 0,95 0,8289439 1,25 0,8943502 0,06 0,5239222 0,36 0,6405764 0,66 0,7453731 0,96 0,8314724 1,26 0,8961653 0,07 0,5279032 0,37 0,6443088 0,67 0,7485711 0,97 0,8339768 1,27 0,8979577 0,08 0,5318814 0,38 0,6480273 0,68 0,7517478 0,98 0,8364569 1,28 0,8997274 0,09 0,5358564 0,39 0,6517317 0,69 0,7549029 0,99 0,8389129 1,29 0,9014747 0,10 0,5398278 0,40 0,6554217 0,70 0,7580363 1,00 0,8413447 1,30 0,9031995 0,11 0,5437953 0,41 0,6590970 0,71 0,7611479 1,01 0,8437524 1,31 0,9049021 0,12 0,5477584 0,42 0,6627573 0,72 0,7642375 1,02 0,8461358 1,32 0,9065825 0,13 0,5517168 0,43 0,6664022 0,73 0,7673049 1,03 0,8484950 1,33 0,9082409 0,14 0,5556700 0,44 0,6700314 0,74 0,7703500 1,04 0,8508300 1,34 0,9098773 0,15 0,5596177 0,45 0,6736448 0,75 0,7733726 1,05 0,8531409 1,35 0,9114920 0,16 0,5635595 0,46 0,6772419 0,76 0,7763727 1,06 0,8554277 1,36 0,9130850 0,17 0,5674949 0,47 0,6808225 0,77 0,7793501 1,07 0,8576903 1,37 0,9146565 0,18 0,5714237 0,48 0,6843863 0,78 0,7823046 1,08 0,8599289 1,38 0,9162067 0,19 0,5753454 0,49 0,6879331 0,79 0,7852361 1,09 0,8621434 1,39 0,9177356 0,20 0,5792597 0,50 0,6914625 0,80 0,7881446 1,10 0,8643339 1,40 0,9192433 0,21 0,5831662 0,51 0,6949743 0,81 0,7910299 1,11 0,8665005 1,41 0,9207302 0,22 0,5870604 0,52 0,6984682 0,82 0,7938919 1,12 0,8686431 1,42 0,9221962 0,23 0,5909541 0,53 0,7019440 0,83 0,7967306 1,13 0,8707619 1,43 0,9236415 0,24 0,5948349 0,54 0,7054015 0,84 0,7995458 1,14 0,8728568 1,44 0,9250663 0,25 0,5987063 0,55 0,7088403 0,85 0,8023375 1,15 0,8749281 1,45 0,9264707 0,26 0,6025681 0,56 0,7122603 0,86 0,8051055 1,16 0,8769756 1,46 0,9278550 0,27 0,6064199 0,57 0,7156612 0,87 0,8078498 1,17 0,8789995 1,47 0,9292191 0,28 0,6102612 0,58 0,7190427 0,88 0,8105703 1,18 0,8809999 1,48 0,9305634 0,29 0,6140919 0,59 0,7224047 0,89 0,8132671 1,19 0,8829768 1,49 0,9318879 134 Tabulka hodnot distribuční funkce normálního rozdělení Tab. 9.2: Hodnoty distribuční funkce Φ(u) - 2.část. u Φ(u) u Φ(u) u Φ(u) u Φ(u) u Φ(u) 1,50 0,9331928 1,80 0,9640697 2,10 0,9821356 2,40 0,9918025 4,50 0,9999966 1,51 0,9344783 1,81 0,9648521 2,11 0,9825708 2,41 0,9920237 5,00 0,9999997 1,52 0,9357445 1,82 0,9656205 2,12 0,9829970 2,42 0,9922397 5,50 0,9999999 1,53 0,9369916 1,83 0,9663750 2,13 0,9834142 2,43 0,9924506 1,54 0,9382198 1,84 0,9671159 2,14 0,9838226 2,44 0,9926564 1,55 0,9394392 1,85 0,9678432 2,15 0,9842224 2,45 0,9928572 1,56 0,9406201 1,86 0,9685572 2,16 0,9846137 2,46 0,9930531 1,57 0,9417924 1,87 0,9692581 2,17 0,9849966 2,47 0,9932443 1,58 0,9429466 1,88 0,9699460 2,18 0,9853713 2,48 0,9934309 1,59 0,9440826 1,89 0,9706210 2,19 0,9857379 2,49 0,9936128 1,60 0,9452007 1,90 0,9712834 2,20 0,9860966 2,50 0,9937903 1,61 0,9463011 1,91 0,9719334 2,21 0,9864474 2,51 0,9939634 1,62 0,9473839 1,92 0,9725711 2,22 0,9867906 2,52 0,9941323 1,63 0,9484493 1,93 0,9731966 2,23 0,9871263 2,53 0,9942969 1,64 0,9494974 1,94 0,9738102 2,24 0,9874545 2,54 0,9944574 1,65 0,9505285 1,95 0,9744119 2,25 0,9877755 2,55 0,9946139 1,66 0,9515428 1,96 0,9750021 2,26 0,9880894 2,56 0,9947664 1,67 0,9525403 1,97 0,9755808 2,27 0,9883962 2,57 0,9949151 1,68 0,9535213 1,98 0,9761482 2,28 0,9886962 2,58 0,9950600 1,69 0,9544860 1,99 0,9767045 2,29 0,9889893 2,59 0,9952012 1,70 0,9554345 2,00 0,9772499 2,30 0,9892759 2,60 0,9953388 1,71 0,9563671 2,01 0,9777844 2,31 0,9895559 2,70 0,9965330 1,72 0,9572838 2,02 0,9783083 2,32 0,9898296 2,80 0,9974449 1,73 0,9581849 2,03 0,9788217 2,33 0,9900969 2,90 0,9981342 1,74 0,9590705 2,04 0,9793248 2,34 0,9903581 3,00 0,9986501 1,75 0,9599408 2,05 0,9798178 2,35 0,9906133 3,20 0,9993129 1,76 0,9607961 2,06 0,9803007 2,36 0,9908625 3,40 0,9996631 1,77 0,9616364 2,07 0,9807738 2,37 0,9911060 3,60 0,9998409 1,78 0,9624620 2,08 0,9812372 2,38 0,9913437 3,80 0,9999277 1,79 0,9632730 2,09 0,9816911 2,39 0,9915758 4,00 0,9999683