Počet pravděpodobnosti jako základ matematické statistiky Pomocí metod popisné statistiky dokážeme přehledně shrnout informace, které se týkají výhradně objektů výběrového souboru. Pokud jsme však data získali na základě dobře navrženého výzkumného plánu, můžeme provádět induktivní úsudky o chování sledovaných proměnných v celém základním souboru. Metody statistické indukce se ovšem opírají o počet pravděpodobnosti. Počet pravděpodobnosti Je to disciplína, která se zabývá studiem zákonitostí v náhodných pokusech. Matematickými prostředky modeluje situace, v nichž hraje roli náhoda. Pod pojmem náhoda rozumíme působení faktorů, které se živelně mění při různých provedeních téhož pokusu a nepodléhají naší kontrole. Pokusem rozumíme jednorázové uskutečnění konstantně vymezeného souboru definičních podmínek. Předpokládáme, že pokus můžeme mnohonásobně nezávisle opakovat za dodržení definičních podmínek (ostatní podmínky se mohou měnit, proto různá opakování pokusu mohou vést k různým výsledkům). Dále předpokládáme, že opakováním pokusu vzniká opět pokus. Deterministický pokus je takový pokus, jehož každé opakování vede k jedinému možnému výsledku. (Např. zahřívání vody na 100°C při atmosférickém tlaku 1015 hPa vede k varu vody.) Náhodný pokus je takový pokus, jehož každé opakování vede k právě jednomu z více možných výsledků, které jsou vzájemně neslučitelné. (Např. hod kostkou vede k právě jednomu ze šesti možných výsledků.) Zavedení měřitelného prostoru Neprázdnou množinu možných výsledků náhodného pokusu značíme Ω a nazýváme ji základní prostor. Možné výsledky značíme ω[1], ω[2], ... Vymezená množina výsledků je náhodný jev, značíme ho symbolem A. Všechny možné náhodné jevy tvoří jevové pole A. Dvojice (Ω, A) se nazývá měřitelný prostor. Ω se nazývá jistý jev, nemožný jev. Vztahy mezi jevy vyjadřujeme pomocí množinových inkluzí a operace s jevy popisujeme pomocí množinových operací. a) A B znamená, že jev A má za důsledek jev B. b) A B znamená nastoupení aspoň jednoho z jevů A, B c) A B znamená společné nastoupení jevů A, B d) A \ B znamená nastoupení jevu A za nenastoupení jevu B e) = Ω \ A znamená jev opačný k jevu A f) A B = znamená, že jevy A, B jsou neslučitelné g) ω A znamená, že možný výsledek ω je příznivý nastoupení jevu A. Některé vlastnosti operací s jevy a) Pro sjednocení a průnik jevů platí komutativní zákon, který pro dva jevy A, B má tvar: A B = B A, A B = B A. b) Pro sjednocení a průnik tří jevů A, B, C platí zákon asociativní: A (B C) = (A B) C, A (B C) = (A B) C distributivní: A (B C) = (A B) (A C), A (B C) = (A B) (A C) c) Pro sjednocení a průnik jevů opačných platí de Morganovy zákony, které pro dva jevy A, B zapíšeme takto: = , = . Zavedení pravděpodobnostního prostoru Uvažme náhodný pokus, při jehož mnohonásobném nezávislém opakování sledujeme nastoupení jevu A, tzv. úspěchu. Označme n celkový počet pokusů a N(A) počet těch pokusů, v nichž nastal jev A (počet úspěchů). N(A) se nazývá absolutní četnost jevu A v n pokusech a podíl se nazývá relativní četnost jevu A v n pokusech. Empirický zákon velkých čísel říká, že s rostoucím počtem pokusů se relativní četnost ustaluje kolem konstanty P(A), kterou považujeme za pravděpodobnost jevu A. Ilustrace empirického zákona velkých čísel Provádíme n nezávislých hodů mincí. Padnutí líce považujeme za úspěch. Budeme sledovat závislost relativní četnosti úspěchu na počtu pokusů. (Počet pokusů volíme 2, 5, 10, 20, 50, 100, 200, 500,1000, 2000.) n 2000 1000 500 200 100 50 20 10 5 2 p 0,4975 0,4900 0,4880 0,5000 0,5800 0,5400 0,6000 0,4000 0,2000 0,5000 Pravděpodobnost však nelze definovat jako limitu relativní četnosti pro počet pokusů n rostoucí nade všechny meze, protože počet pokusů je vždy konečný a nelze se přesvědčit o existenci této limity. Proto pravděpodobnost zavádíme axiomaticky: Pravděpodobností rozumíme reálnou množinovou funkci P: A → R, která splňuje následující tři axiómy: každému jevu přiřazuje nezáporné číslo (axióm nezápornosti), jistému jevu přiřazuje číslo 1 (axióm normovanosti), sjednocení neslučitelných jevů přiřazuje součet pravděpodobností těchto jevů (axióm spočetné aditivity). Trojice (Ω, A, P) se nazývá pravděpodobnostní prostor. Je to matematický model jednorázového provedení náhodného pokusu. (Axiómy pravděpodobnosti jsou zvoleny tak, aby pravděpodobnost byla zidealizovaným protějškem relativní četnosti zavedené v popisné statistice. Má tedy všechny vlastnosti relativní četnosti a ještě některé vlastnosti navíc, které vyplývají z vnitřních potřeb matematické teorie. Autorem axiomatické definice pravděpodobnosti je ruský matematik A. N. Kolmogorov.) [LINK] Andrej Nikolajevič Kolmogorov (1903 – 1987): Ruský matematik Ilustrace pravděpodobnostního prostoru Vlastnosti pravděpodobnosti Nechť (Ω, A, P) je pravděpodobnostní prostor. Pak pro libovolné jevy A, A[1], A[2], ... A platí následujících 14 vlastností: P1: P( ) = 0 P2: P(A) ≥ 0 (nezápornost – axióm) P3: P(A[1] A[2]) + P(A[1] A[2]) = P(A[1]) + P(A[2]) P4: 1 + P(A[1] A[2]) ≥ P(A[1]) + P(A[2]) P5: P(A[1] A[2]) ≤ P(A[1]) + P(A[2]) (subaditivita) P6: A[1] A[2 ]= P(A[1] A[2]) = P(A[1]) + P(A[2]) (aditivita) P7: P(A[2] \ A[1]) = P(A[2]) - P(A[1] A[2]) P8: A[1] A[2] P(A[2] \ A[1]) = P(A[2]) - P(A[2]) (subtraktivita) P9: A[1] A[2] P(A[1]) ≤ P(A[2]) (monotonie) P10: P(Ω) = 1 (normovanost – axióm) P11: P(A) + P( ) = 1 (komplementarita) P12: P(A) ≤ 1 P13: A[i] A[j] = pro i ≠ j P(A[1] A[2] ... ) = P(A[1]) + P(A[2]) + ... (spočetná aditivita – axióm) P14: P( ) = (Pro neslučitelné jevy A[1], ..., A[n] dostáváme P( ) = .) (Vlastnosti P1, ..., P12 odpovídají vlastnostem relativní četnosti z popisné statistiky, vlastnost P14 je známa jako věta o sčítání pravděpodobností.) Klasická pravděpodobnost V Kolmogorovově axiomatické definici se nic nepraví o tom, jak na daném měřitelném prostoru konkrétně pravděpodobnost zavést. V případě, že základné prostor je konečný a všechny možné výsledky mají stejnou šanci na uskutečnění, můžeme použít klasickou pravděpodobnost: Klasická pravděpodobnost je funkce, která jevu A přiřazuje číslo , kde m(A) je počet možných výsledků příznivých nastoupení jevu A a m(Ω) je počet všech možných výsledků. Příklad na klasickou pravděpodobnost (s využitím vlastností pravděpodobnosti): V dodávce 100 kusů výrobků nemá požadovaný průměr 10 kusů, požadovanou délku 20 kusů a současně nemá požadovaný průměr i délku 5 kusů. Jaká je pravděpodobnost, že náhodně vybraný výrobek z této dodávky má požadovaný průměr i délku? Řešení: Jev A spočívá v tom, že výrobek má požadovaný průměr a jev B v tom, že výrobek má požadovanou délku. Počítáme P(A B) = = 1 – P( ) = 1 – [P( ) + P( ) – P( )] = 1 – ( ) = 0,75. Opakované závislé pokusy - hypergeometrické rozložení pravděpodobností Máme N objektů, mezi nimi je M objektů označeno, . Náhodně bez vracení vybereme n objektů ( ). Pravděpodobnost, že ve výběru je právě x označených objektů ( ): . Pravděpodobnost, že ve výběru je nejvýše x[1] označených objektů: . Pravděpodobnost, že ve výběru je aspoň x[0] označených objektů: . Příklad na hypergeometrické rozložení pravděpodobností: Máme skupinu 20 lidí, mezi nimi 4 muže. Vybíráme bez vracení (tj. nikdo nemůže být vybrán opakovaně) pětici z této skupiny. Jaký je nejpravděpodobnější počet mužů mezi vybranými? Řešení: Vypočítáme všechny možné pravděpodobnosti a najdeme počet mužů s největší pravděpodobností. Vzhledem k technice výběru (bez vracení) jde o hypergeometrické rozložení pravděpodobností s parametry N = 20, M = 4, n = 5. Počítáme pro x = 0, 1, 2, 3, 4. , , , , (Pro kontrolu – součet vypočítaných pravděpodobností je 1.) Vidíme, že nejvyšší pravděpodobnost – 0,4696 – je dosažena v případě, kdy mezi pěticí vybraných osob je právě 1 muž. Stochasticky nezávislé náhodné jevy Za stochasticky nezávislé považujeme takové jevy, kdy informace o nastoupení jednoho jevu nijak neovlivní šance, s nimiž očekáváme nastoupení druhého jevu. V popisné statistice jsme zavedli četnostní nezávislost dvou množin G[1], G[2] v daném výběrovém souboru pomocí multiplikativního vztahu . V počtu pravděpodobnosti řekneme, že jevy A[1], A[2] A jsou stochasticky nezávislé, jestliže P(A[1] A[2]) = P(A[1]) P(A[2]). Pro tři jevy budeme požadovat, aby i jevy A[1] A[2] a A[3] byly stochasticky nezávislé, což vede ke vztahu P(A[1] A[2] A[3]) = P(A[1]) P(A[2]) P(A[3]). Tak můžeme pokračovat pro libovolný počet jevů. (Lze snadno ukázat, že jev nemožný resp. jev jistý a libovolný jev jsou stochasticky nezávislé jevy. Jestliže v posloupnosti stochasticky nezávislých jevů nahradíme libovolný počet jevů jevy opačnými, stochastická nezávislost se neporuší. Rovněž tak průniky a sjednocení stochasticky nezávislých jevů jsou stochasticky nezávislé.) Příklad na stochasticky nezávislé jevy: Nechť A[1], A[2], A[3] jsou stochasticky nezávislé jevy, P(A[1]) = 1/4, P(A[2]) = 1/3, P(A[3]) = 1/2. Jaká je pravděpodobnost, že a) nastane právě jeden z jevů A[1], A[2], A[3] b) nastanou právě dva z jevů A[1], A[2], A[3] c) nastanou nejvýše dva z jevů A[1], A[2], A[3] ? Řešení: ad a) ad b) ad c) 1-P(A[1]) P(A[2]) P(A[3]) = Opakované nezávislé pokusy: Nezávisle opakujeme týž náhodný pokus. Nechť jev A[i] znamená úspěch v i-tém pokusu, přičemž P(A[i]) = , i = 1, 2, ... 1. Binomické rozložení pravděpodobností Pravděpodobnost, že v prvních n pokusech úspěch nastane právě x-krát, je rovna Pravděpodobnost, že v prvních n pokusech úspěch nastane aspoň x[0]-krát (0 ≤ x[0] ≤ n), je rovna Pravděpodobnost, že v prvních n pokusech úspěch nastane nejvýše x[1]-krát (0 ≤ x[1] ≤ n), je rovna Pravděpodobnost, že v prvních n pokusech úspěch nastane aspoň x[0]-krát a nejvýše x[1]-krát, je rovna Příklad na binomické rozložení pravděpodobností: Firma se účastní čtyř nezávislých výběrových řízení. Pravděpodobnost, že uspěje v kterémkoliv z nich, je pro všechny konkurzy stejná a je rovna 0,7. Jaká je pravděpodobnost, že firma uspěje a) právě 2x b) aspoň 2x c) nejvýše 2x? Řešení: Počet pokusů n = 4, pravděpodobnost úspěchu = 0,7 ad a) ad b) ad c) 2. Geometrické rozložení pravděpodobností Pravděpodobnost, že prvnímu úspěchu bude předcházet x neúspěchů: . Pravděpodobnost, že prvnímu úspěchu bude předcházet nejvýše x[1] neúspěchů: Pravděpodobnost, že prvnímu úspěchu bude předcházet aspoň x[0] neúspěchů: Příklad na geometrické rozložení pravděpodobností: Jaká je pravděpodobnost, že při hře „Člověče, nezlob se!“ nasadíme figurku nejpozději při třetím hodu? Řešení: Počet neúspěchů: x = 0, 1, 2, pravděpodobnost úspěchu: Pravděpodobnost, že figurku nasadíme nejpozději při třetím hodu, je 42,13%. 3. Negativní binomické rozložení pravděpodobností Pravděpodobnost, že k-tému úspěchu bude předcházet x neúspěchů: . Pravděpodobnost, že k-tému úspěchu bude předcházet nejvýše x[1] neúspěchů: . Pravděpodobnost, že k-tému úspěchu bude předcházet aspoň x[0] neúspěchů: . Příklad na negativní binomické rozložení pravděpodobností: Hráč hází kostkou tak dlouho, dokud mu nepadnou tři šestky. Jaká je pravděpodobnost, že bude muset hodit kostkou 10 x? Řešení: Počet neúspěchů x = 7, protože v 7 z 10 hodů nepadne šestka. Pravděpodobnost úspěchu Hledaná pravděpodobnost je 4,65%. Podmíněná pravděpodobnost Opakovaně nezávisle provádíme týž náhodný pokus a sledujeme nastoupení jevu A v těch pokusech, v nichž nastoupil jev H. Podmíněnou relativní četnost A za podmínky H jsme v popisné statistice zavedli vztahem (za předpokladu, že p(H) > 0). Tato podmíněná relativní četnost se s rostoucím počtem pokusů ustaluje kolem konstanty , kterou považujeme za podmíněnou pravděpodobnost jevu A za podmínky H. Ilustrace podmíněné pravděpodobnosti Vlastnosti podmíněné pravděpodobnosti Je zřejmé, že jevy A[1], A[2] jsou stochasticky nezávislé, právě když P(A[1]/A[2]) = P(A[1]) a právě když P(A[2]/A[1]) = P(A[2]). Okamžitě z definice plyne: P(A[1] A[2]) = P(A[1]) P(A[2]/A[1]) pro P(A[1]) > 0, P(A[1] A[2]) = P(A[2]) P(A[1]/A[2]) pro P(A[2]) > 0. Tento multiplikativní vztah lze zobecnit ve větu o násobení pravděpodobností: P(A[1] A[2] ... A[n]) = P(A[1]) P(A[2]/A[1]) P(A[3]/A[1] A[2]) ... P(A[n]/A[1] ... A[n-1]) pro P(A[1] ... A[n-1]) 0. Příklad na větu o násobení pravděpodobností: Ze sady 32 karet náhodně vytahujeme po jedné kartě, kterou nikdy nevracíme zpět. Jaká je pravděpodobnost, že eso se objeví až ve 4. tahu? Řešení: A[i] … v i-tém tahu nebylo vybráno eso, i = 1, 2, 3, 4 Eso se objeví až ve 4. tahu s pravděpodobností 0,0911. Vzorec pro úplnou pravděpodobnost a Bayesův vzorec Jestliže H[1], …, H[n] A jsou jevy, které tvoří rozklad jistého jevu (tj. jsou neslučitelné a jejich sjednocením je celý základní prostor – říkáme, že tvoří úplný systém hypotéz), pak pravděpodobnost libovolného jevu A A lze vypočítat pomocí vzorce pro úplnou pravděpodobnost: . Ilustrace vzorce pro úplnou pravděpodobnost Podmíněnou pravděpodobnost libovolné hypotézy za podmínky, že nastal jev A (tzv. aposteriorní pravděpodobnost P(H[k]/A) ) lze vypočítat pomocí Bayesova vzorce: . (Původní pravděpodobnost P(H[k]) se nazývá apriorní pravděpodobnost). Thomas Bayes (1702 – 1761): Anglický kněz a matematik Příklad na vzorec pro úplnou pravděpodobnost a Bayesův vzorec: U jistého druhu elektrického spotřebiče se s pravděpodobností 0,01 vyskytuje výrobní vada. U spotřebiče s touto výrobní vadou dochází v záruční lhůtě k poruše s pravděpodobností 0,5. Výrobky, které tuto vadu nemají, se v záruční lhůtě porouchají s pravděpodobností 0,01. Jaká je pravděpodobnost, že a) u náhodně vybraného výrobku nastane v záruční lhůtě porucha, b) výrobek, který se v záruční lhůtě porouchá, bude mít dotyčnou výrobní vadu? Řešení: H[1] - výrobek má dotyčnou výrobní vadu H[2] - výrobek nemá tuto výrobní vadu A - výrobek se v záruční době porouchá Pak je: P(H[1]) = 0,01, P(H[2]) = 0,99, P(A/H[1]) = 0,5, P(A/H[2]) = 0,01 ad a) P(A) = P(H[1]).P(A/H[1]) + P(H[2]).P(A/H[2]) = 0,01.0,5 + 0,99.0,01 = 0,0149 ad b)