Základy pravděpodobnosti David Hampel 12235@mail.muni.cz Přednáška Statistika 1 (BKMSTAI) 23. říjen 2011, Brno David Hampel Základy pravděpodobnosti Motivace ► Teorie pravděpodobnosti se snaží matematicky popsat činnosti („pokusy"), jejichž výsledek není předem jistý. ► Matematická statistika (odhady parametrů a testování hypotéz o nich) je založena na výsledcích teorie pravděpodobnosti. ► Ačkoliv není teorie pravděpodobnosti mnohdy přímo aplikovatelná, pro celkové pochopení statistiky je její znalost nutná. David Hampel Základy pravděpodobnosti Pokus ► Pokusem rozumíme jednorázové uskutečnění konstantně vymezeného souboru definičních podmínek. Předpokládáme, že pokus můžeme mnohonásobně nezávisle opakovat za dodržení definičních podmínek (ostatní podmínky se mohou měnit, proto různá opakování pokusu mohou vést k různým výsledkům). ► Deterministickým pokusem nazýváme takový pokus, jehož každé opakování vede k jedinému možnému výsledku. (Např. zahřívání vody na 100 °C při atmosférickém tlaku 1015 hPa vede k varu vody.) ► Náhodným pokusem nazýváme takový pokus, jehož každé opakování vede k právě jednomu z více možných výsledků, které jsou vzájemně neslučitelné. David Hampel Základy pravděpodobnosti Náhodný jev a jeho pravděpodobnost ► Neprázdnou množinu možných výsledku náhodného pokusu značíme íž a nazýváme ji základní prostor. Možné výsledky značíme ujt, t G T kde T je indexová množina. Příklad: hážeme jedenkrát jednou pravidelnou šestistěnnou kostkou. Základním prostorem je množina {1,2,3,4,5,6}. ► Jevem nazveme kombinace prvků základního prostoru, které můžeme přesně popsat. Jevem je: ► Padne pětka. ► Padne jednička nebo dvojka. ► Padne liché číslo. ► Padne číslo vyšší nebo rovné třem. Jevem není: ► Dva. ► Padne vysoké číslo. David Hampel Základy pravděpodobnosti Náhodný jev a jeho pravděpodobnost ► Zvláštním případem je jev nemožný - sice jsme přesně popsali možný výsledek pokusu, ale tento výsledek nemůže nastat (není kombinací prvků základního prostoru). ► Padne číslo devět. ► Označení používaná v souvislosti s jevy jev jistý 0 jev nemožný společné nastoupení U At nastoupení alespoň iei jevů Ai, i £ I iei jednoho z jevů Ai, i G / Ai, A\ opačný jev k jevu Ai Ai\A2 nastoupení jevu A\ za nenastoupení jevu A2 Ai C A2 jev A\ má za důsledek Ai n A2 = 0 jevy A\ a A2 jsou ne- jev A2 slučitelné David Hampel Základy pravděpodobnosti Náhodný jev a jeho pravděpodobnost ► Pravděpodobností rozumíme funkci, která každému jevu přiřadí reálné číslo tak, aby platily následující podmínky: ► nezápornost P (A) > 0 VA ► spočetná aditivita i ^ j P(Ai n Aj) — 0 =>• i=l i=l normovanost i=l p(n) = i. David Hampel Základy pravděpodobnosti Klasická pravděpodobnost Označme m(íž) počet všech možných výsledku a m(A) počet výsledku příznivých nastoupení jevu A. Pak funkci P(A) m{A) m(íí) nazveme klasickou pravděpodobností. Předpokladem použití klasické pravděpodobnosti je, aby každý výsledek pokusu nastal se stejnou pravděpodobností. Příklad: hážeme jedenkrát jednou pravidelnou šestistěnnou kostkou. Díky pravidelnosti kostky je padnutí každého z čísel stejně pravděpodobné. Chceme spočítat pravděpodobnost jevu A: padne sudé číslo. Máme m(íž) = 6, m(A) = 3 a P (A) m(A) m(íí) i -00.0 David Hampel Základy pravděpodobnosti Klasická pravděpodobnost - příklad Jaká je pravděpodobnost, že při současném hodu šesti kostkami padne ► na každé kostce jiné číslo P(A) = S = -^L = 0.01543 ► právě šest šestek P{B) 66 46656 1 1 ► právě pět šestek P(C) = 66 46656 6-5 30 66 46656 = 0.0000021 = 0.000643 právě čtyři šestky P(D) = = = 0-008037 v ; 66 46656 ► samá sudá čísla 3b 729 0.015625 66 46656 '•< n ► o ► David Hampel Základy pravděpodobnosti Klasická pravděpodobnost - příklad Mezi N výrobky je M zmetků. Náhodně bez vracení vybereme n výrobků. Jaká je pravděpodobnost, že vybereme právě k zmetků? Základní prostor íž je tvořen všemi neuspořádanými ra-ticemi vytvořenými z N prvků. Tedy m(íž) = (^). Jev A spočívá v tom, že vybereme právě k zmetků z M zmetků (ty lze vybrat způsoby) a výběr doplníme n — k kvalitními výrobky vybranými z N — M kvalitních výrobků (tento výběr lze provést (^Zjf) způsoby). Podle kombinatorického pravidla součinu dostáváme m(A) m(íí) David Hampel Základy pravděpodobnosti Podmíněná pravděpodobnost Nechť H je jev s nenulovou pravděpodobností. Pak definujeme podmíněnou pravděpodobnost vzorcem Interpretace této pravděpodobnosti může být následující: víme, že jev H již nastal, a ptáme se na pravděpodobnost, s jakou za této podmínky nastane ještě jev A. Důležitou aplikací podmíněné pravděpodobnosti je věta o násobení pravděpodobností: i' P(f| Ai) = P(A1)-P(A2\A1)-P(A3\A1nA2).....P{An\A^- ■ -nA^) i=i David Hampel Základy pravděpodobnosti Podmíněná pravděpodobnost - příklad Z 5 výrobků, mezi nimiž jsou 3 zmetky, vybíráme bez vracení po jednom výrobku. Označíme Ay. první vybraný výrobek byl kvalitní, A2: druhý vybraný výrobek byl zmetek, A3: třetí vybraný výrobek byl zmetek. Hledáme P(Ai n A2 n A3). P(A1nA2nA3) = P(A1yP(A2\A1)-P(A3\A1nA2) = --I = 0.2 5 4 ô David Hampel Základy pravděpodobnosti Formule úplné pravděpodobnosti Nechť je dán rozklad {Hí,i G /} základního prostoru na nejvýše spočetně mnoho jevů Hi o nenulových pravděpodobnostech P(Hi). Říkáme, že je dán úplný systém hypotéz. Potom pro libovolný jev A platí formule úplné pravděpodobnosti P{A) = YdP{Hi)-P{A\Hi). íei David Hampel Základy pravděpodobnosti Formule úplné pravděpodobnosti - příklad V první sadě výrobků je 12 výrobků, z toho 1 zmetek. Ve druhé sadě výrobků je 10 výrobků, z toho 1 zmetek. Náhodně zvolený výrobek jsme přemístili z první sady do druhé. Poté jsme ze druhé sady náhodně vybrali jeden výrobek. Jaká je pravděpodobnost, že to byl zmetek? Označíme A: výrobek vybraný ze druhé sady byl zmetek H\\ výrobek přemístěný z první sady do druhé byl kvalitní H2: výrobek přemístěný z první sady do druhé byl zmetek Máme 111 19 1 s p(A) = pm-PiAm+pm-PiAm = _._+_._ = _ David Hampel Základy pravděpodobnosti Bayesův vzorec Nechť je dán úplný systém hypotéz {Hi, i G /}. Potom pro jev A s nenulovou pravděpodobností a pro libovolný jev Hk platí tzv. I. Bayesův vzorec P(Hk\A)- ^>^™ E P{Hi) ■ P{A\Hi) iei David Hampel Základy pravděpodobnosti Bayesův vzorec - příklad U jistého druhu elektrického spotřebiče se s pravděpodobností 0.1 vyskytuje výrobní vada. U spotřebiče s touto výrobní vadou dochází v záruční lhůtě k poruše s pravděpodobností 0.5. Výrobky, které tuto vadu nemají, se v záruční lhůtě porouchají s pravděpodobností 0.01. Jaká je pravděpodobnost, že výrobek, který se v záruční době porouchá, bude mít dotyčnou výrobní vadu? Označíme A: výrobek se v záruční době porouchá H\\ výrobek má výrobní vadu H2: výrobek nemá výrobní vadu P{HM) P{H{) • P{A\H{) 0.1-0.5 = 0.847 P(#i) • P{A\H{) + P(H2) • P(A\H2) 0.059 David Hampel Základy pravděpodobnosti Stochastická nezávislost Řekneme, že jevy A±, A2,..., An jsou stochasticky nezávislé, právě když platí vztahy Vi kde x\ je výsledek i-tého alternativního pokusu. Pravděpodobnost nastoupení právě y úspěchů z n pokusů má tzv. binomické rozdělení dané vztahem p(x) = ex(i - e) x G {0,1}- Opakované nezávislé pokusy - příklad Pětkrát nezávisle na sobě hážeme třemi kostkami. Jaká je pravděpodobnost, že právě ve dvou hodech padnou tři jedničky? Pravděpodobnost, že v jednom hodu třemi kostkami padnou tři jedničky je 0 = = —j^. Dle vzorce binomického rozdělení máme (55)'('-sí)"- = 10 • 0.00002143 • 0.98617 = 0.0002. David Hampel Základy pravděpodobnosti Některé důsledky pro výpočet pravděpodobností David Hampel Základy pravděpodobnosti Podmíněná pravděpodobnost v různých situacích Předpokládejme, že p(h) ^ 0. Čemu je rovna pravděpodobnost p{a\h), jsou-li jevy a; h a) stochasticky nezávislé P{A]H) = ^IlEi = pw-pw = p(a) v 1 ' p{h) p{h) v ' David Hampel Základy pravděpodobnosti Podmíněná pravděpodobnost v různých situacích Předpokládejme, že P(H) ^ 0. Čemu je rovna pravděpodobnost P{A\H), jsou-li jevy A; H b) neslučitelné P(A n H) P(0) P(A\H) P(H) P(H) David Hampel Základy pravděpodobnosti Podmíněná pravděpodobnost v různých situacích Předpokládejme, že P(H) ^ 0. Čemu je rovna pravděpodobnost P{A\H), jsou-li jevy A; H c) H má za důsledek A V 1 ' P{H) P{H) David Hampel Základy pravděpodobnosti Podmíněná pravděpodobnost v různých situacích Předpokládejme, že P(H) ^ 0. Čemu je rovna pravděpodobnost P{A\H), jsou-li jevy A; H d) A má za důsledek H P{A n H) P{A) P(A\H) P(H) P(H) David Hampel Základy pravděpodobnosti Nastoupení alespoň jednoho z jevů Vyjádřete pravděpodobnost n i=i ► za předpokladu, že Ai,..., An jsou neslučitelné n n i=l i=l David Hampel Základy pravděpodobnosti Nastoupení alespoň jednoho zjevů Vyjádřete pravděpodobnost i' 1=1 ► za předpokladu, že A±,..., An jsou neslučitelné n n P([JAl) = ^2P(Al) i=l i=l ► za předpokladu, že A±,..., An jsou nezávislé n n P(\JAí) = l-l[(l-P(Ai)) i=l i=l <|> <|> 1 -Oo^o David Hampel Základy pravděpodobnosti Společné nastoupení jevů Vyjádřete pravděpodobnost ► za předpokladu, že A±,..., An jsou neslučitelné i=l David Hampel Základy pravděpodobnosti Společné nastoupení jevů Vyjádřete pravděpodobnost i' ► za předpokladu, že A±,..., An jsou neslučitelné i' i=l ► za předpokladu, že A±,..., An jsou nezávislé n n p(n^)=np(^) i=l i=l <|> <|> 1 -Oo^o David Hampel Základy pravděpodobnosti Aplikace pravděpodobnosti 4 □ ► 0,10 Firmě se s novou plachetnicí vyplatí vstoupit na trh. P(Ht\A) = PWP'f|g<) = °-01 48 =0.0427 v ' ' P (A) 0,1124 Ti zákazníci, kteří skutečně plachetnici koupili, předtím zaškrtli „nekoupil bych" s pravděpodobností 0,0427. David Hampel Základy pravděpodobnosti Zloději ve firmě Firma pokládá náhodně vybraným zaměstnancům otázku: „Odnesli jste si během minulého roku některý z našich výrobků bez zaplacení?" Aby je ujistila o anonymitě dotazníku, připojuje tuto instrukci: Hoďte si v soukromí mincí a padne-li líc, odpovězte bez ohledu na skutečnost „ano", jestliže padne rub odpovězte ve shodě se skutečností „ano", nebo „ne". a) Zvolte matematický model. b) Vypočtěte pravděpodobnost odpovědi „ano" a pravděpodobnost vylosování zloděje. c) Aproximujte pravděpodobnost vylosování zloděje, bylo-li dotázáno n osob, z nichž a osob odpovědělo „ano". David Hampel Základy pravděpodobnosti Zloději ve firmě - řešení a) Zvolte matematický model. Náhodný pokus spočívá ve vylosování jedné osoby a v jednom hodu mincí. L ... padl líc K ... byl vylosován zloděj A . . .vylosovaný odpověděl „ano" David Hampel Základy pravděpodobnosti Zloději ve firmě - řešení b) Vypočtěte pravděpodobnost odpovědi „ano" a pravděpodobnost vylosování zloděje. P{A) = P{LU{L'CiK)) = P{Ľ) + P{Ľ) ■ P{K) P(K) = 2P(A) - 1 David Hampel Základy pravděpodobnosti Zloději ve firmě - řešení c) Aproximujte pravděpodobnost vylosování zloděje, bylo-li dotázáno n osob, z nichž a osob odpovědělo „ano". P(A) « -n P(K) n David Hampel Základy pravděpodobnosti Antidrogový test Jistá společnost podrobuje uchazeče o zaměstnání antidrogovému testu. Uchazeči pochází z oblasti, kde pouze půl procenta obyvatel užívá drogy. Citlivost užívaného testu je 99 % (tzn., že u 99 % narkomanů test vyjde pozitivně) a dále test je specifický také na 99 % (Tzn., že test vyjde negativně u 99 % „ne-narkomanů"). Zdá se tedy, že test je relativně přesný. Určete pravděpodobnost, že osoba, jejíž výsledek testu je pozitivní, skutečně užívá drogy. David Hampel Základy pravděpodobnosti Antidrogový test - řešení P(A) ... u náhodně vybraného uchazeče test vyjde pozitivně P(-ffi) ■ ■ ■ uchazeč bere drogy P(#2) ■ ■ ■ uchazeč nebere drogy P(Fi)=0,005 P(A|Fi)=0,99 P(F2)=0,995 P(A\H2)=1-P(A'\H2)=0,01 David Hampel Základy pravděpodobnosti Antidrogový test - řešení P (A) = + P{H2)P{A\H2) = 0,005-0,99 + 0,995-0,01 = 0,0149 r,/TT,.N P{Hi)P{A\Hi) 0,005-0,99 PÍHAA) = v ' , \ 1 ' =--■— = 0, 3322 v 1 ' P(A) 0,0149 Pravděpodobnost, že uchazeč, jemuž vyšel test pozitivně, skutečně bere drogy, je pouze 33,22 %. Je tedy více pravděpodobné, že drogy nebere! Čím menší je pravděpodobnost zkoumaného jevu (Hi), tím větší je pravděpodobnost, že test bude „falešně" pozitivní. P{A ílffi) = 0, 00495 < P(A n H2) = 0, 00995 David Hampel Základy pravděpodobnosti