Pravděpodobnost a popisná statistika Helena Durnová 22. dubna 2016 Obsah 1 Z historie pravděpodobnosti 1 2 Náhodné jevy 2 3 Klasická pravděpodobnost 4 4 Podmíněná pravděpodobnost 6 5 Nezávislé jevy 7 6 Zajímavé úlohy 8 7 Popisná statistika 9 8 Příklady k procvičení (z písemek z minulých let 12 Úvodní poznámky Toto je pracovní verze studijního textu pro předmět Pravděpodobnost a popisná statistika pro studenty matematiky Pedagogické fakulty Masarykovy univerzity v Brně. Obtížnější příklady jsou označeny hvězdičkou (*). Připomínky vítám. Pište, prosím, na adresu hdurnova@ped.muni.cz 1 Z historie pravděpodobnosti Od poloviny 17. do poloviny 19. století • korespondence Blaise Pascal (1623-1662) a Pierre Fermat (1601 nebo 1607/8 - 1665) v r. 1654 • Christian Huygens (1629-1695): De ratiociniis in ludo aleae (1657) 1 • pozorování demografického vývoje — vedoucí k pojistné matematice — 17. století (Anglie, Nizozemí) • Jakob Bernoulli, Ars conjectandi (1713), napsána v 80. letech 17. století • Abraham de Moivre (1667-1754): pronikání metod diferenciálního a integrálního počtu do teorie pravděpodobnosti • Karl Friedrich Gauss (1777-1855): uplatňoval teorii pravděpodobnosti při zpracování výsledků astronomických a geoetických pozorování • Thomas Bayes (1701/1702-1761): Bayesova věta (podmíněná pravděpodobnost) • George Louis Leclerc Buffon (1707-1788): úloha o jehle • Pierre Simon Lapiace (1749-1827): Théorie analytique des probabilités (1812) • Siméon Denis Poisson (1781-1840): Recherches sur la probabilitě des jugements en matiěre criminelle et en matiěre civile, précédés des rěgles générales du calcul des probabilités (1837) Konec 19. století • teorie markovských řetězců • matematická statistika: Karl Pearson (1857-1936), Francis Galton (1822— 1911) • statistická fyzika: Ludwig Boltzmann (1844-1906), James Clerk Maxwell (1831-1879) (Podrobněji viz např. Macák ) 2 Náhodné jevy Motivační úloha Jaká je pravděpodobnost toho, že při současném hodu dvěma kostkami padne součet 10? (Jinými slovy: padnou dvě čísla, jejichž součet je 10.) Možné součty: 10 = 6 + 4 = 5 + 5 Jaká je pravděpodobnost toho, že při současném hodu dvěma kostkami padne součet 9? Možné součty: 9 = 6 + 3 = 5 + 4 Možných rozkladů čísel 9 a 10 je stejně, přesto součet 9 padá častěji než součet 10. Proč? Součty 9 a 10 musí padat stejně často, máme-li dvě kostky 2 jedné barvy, nebo máme-li kostky dvou různých barev.Z kombinatorického hlediska se tedy musí jednat o počet kompozic čísla 9, popř. 10, ze dvou sčítanců menších nebo rovných 6, nikoliv o počet rozkladů. Pro obě čísla existují dva takové rozklady, ale počty možných kompozic se liší. Nezáleží-li na pořadí sčítanců, máme v obou případech dvě možnosti, avšak pokud na pořadí záleží,máme tři možnosti v případě součtu 10 a čtyři v případě součtu 9: 10 = 6 + 4 = 5 + 5 = 4 + 6 9=6+3=5+4=4+5=3+6 Při výpočtu pravděpodobnosti bereme v úvahu celkový počet kompozic ze dvou sčítanců hodnoty 1 až 6; těch je 36. Vyzkoušejte sami: Házejte dvěma kostkami a počítejte, kolikrát vám padly jednotlivé součty. Výsledky zapište do tabulky: součet 2 3 4 5 6 7 8 9 10 11 12 počet Náhodný pokus Definice 1 Neprázdnou množinu všech možných výsledků náhodného pokusu nazýváme základní prostor a označujeme $1. Prvky množiny $1 označujeme ut, kde t £ T je vhodný index. Definice 2 Systém podmnožin A základního prostoru $1, který a) obsahuje základní prostor; b) s každými dvěma podmnožinami obsahuje i jejich rozdíl; a c) s každým konečným [spočetným] systémem množin obsahuje i jejich sjednocení nazýváme jevové pole. Jevové pole pro náhodný pokus „házení kostkou": Možné výsledky: 1, 2, 3, 4, 5, 6; tj. $1 = {1,2,3,4,5,6} (jednotlivá čísla označují skutečnost, že padlo dané číslo) A = {0, $1} — triviální jevové pole [Kontrolní otázka: musí být prázdná množina prvkem .4?] fí = {0,ft,{2,4,6}} 3 C = {0, íí, {1, 3, 5}, {2,4, 6}} P = {0,Í7,{1},{2},{3},{4},{5},{6}} Náhodný jev: libovolný prvek jevového pole (množina). [Úkol: Popište vlastními slovy některé náhodné jevy podle A, B, C, T>] Označení: Jev jistý: $1 Jev nemožný: 0 Jev elementární: ují pro ují £ $1 Společné nastoupení jevů A a B: A(~) B Nastoupení alespoň jednoho z jevů A, B: A U B Jev opačný k jevu A: Ai = íl\Ai Je zřejmé, že jev nemožný a jev jistý jsou navzájem jevy opačné. Definice 3 Pravděpodobností rozumíme funkci P : A —> M (z množiny všech jevů do množiny reálných čísel), která je a) nezáporná [pravděpodobnost nemůže nabývat záporných hodnot]; b) spočetně aditivní [pravděpodobnosti sčítáme]; a c) normovaná [pravděpodobnost jevu jistého je rovna 1]. Trojici ($1, A, P) (tj. základní prostor, jevové pole, pravděpodobnostní funkce) nazýváme pravděpodobnostní prostor. Zřejmě P (A) = 1 — P (A) (součet pravděpodobností daného jevu a jevu k němu opačného je rovna 1, neboť jejich sjednocení je $1 - jev jistý). 3 Klasická pravděpodobnost Klasická definice pravděpodobnosti považuje všechny elementární jevy za stejně možné. Pravděpodobnost toho, že nastane jev A, pak vypočteme podle vzorce F[A) ~ m(íí) (A je množina počet příznivých jevů, $1 množina všech možných jevů). Vzorec lze použít pro takové situace, kdy dokážeme vypsat všechny případy, které mohou nastat; např. hra v kostky, hody mincí, výběry kared, výběry kuliček z klobouků a další. 4 Geometrická pravděpodobnost je speciálním případem klasické pravděpodobnosti. Název vychází z toho, že některé úlohy lze snáze řešit pomocí výpočtu obsahu nějakého útvaru (popř. objemu). Vzorec pro výpočet geometrické pravděpodobnosti: V ' V{E) Podle tohoto vzorce postupujeme v případě, že např. daný okamžik může nastat v libovolnou chvíli se stejnou pravděpodobností (čekání na kamaráda). Načrtneme si obrázek tak, aby odpovídal situaci. Každý bod útvaru představuje jev, který mohl nastat, a to pro všechny možné jevy. V tomto útvaru pak ohraničíme množinu (měřitelnou) všech příznivých jevů. Známá je např. Buffonova úloha o jehle. Pravděpodobnosti (funkční hodnoty pro jednotlivé jevy) můžeme sčítat, počítáme-li pravděpodobnost sjednocení dvou disjunktních jevů. Abychom mohli použít vzorce, je dobré si jednotlivé jevy symbolicky zapsat (jevy jsou množiny, můžeme je tedy sjednocovat, hledat jejich průnik, rozdíl atd.) Sčítání pravděpodobností Vyjdeme-li z klasické definice pravděpodobnosti, zřejmě lze pravděpodobnost jevu A spočítat jako součet pravděpodobnosti toho, že nastane jev A a přitom nastane jev B a pravděpodobnosti toho, že nastane A a přitom nenastane B, tj.: A = (AnB)u(AnB), kde B je doplněk jevu B. Tedy P (A) = P{A HB)+ P{A n B) Dále zřejmě pravděpodobnost toho, že nastane alespoň jeden z obou jevů lze vypočítat analogicky jako počet prvků sjednocení dvou množin, tedy P {A UB) = P (A) + P(B) - P {A n B) Pro pravděpodobnost sjednocení více jevů použijeme tzv. princip inkluze a exkluze, známý z kombinatoriky. Vzhledem k tomu, že jsme si výše ukázali, jak vyjádřit jevy pomocí množinové symboliky, můžeme vyslovit následující věty: Věta 4 (Věta o sčítání pravděpodobností pro dva jevy) Nechť A±, A2 G A jsou dva libovolné jevy. Pak platí: P{A1 U A2) = P(A1) + P{A2) - P{A1 n A2) 5 Věta 5 (Věta o sčítání pravděpodobností (zobecnění pro n jevů)) : Nechť A±, A2,..., An £ A jsou libovolné jevy. Pak platí: n n n—l n p(U^) = Ep(^)-E E p(AinAj) + - iai i=i i=i j=i+i - + (-i)n-1P(AinA2n...n4-i) 4 Podmíněná pravděpodobnost Úplná pravděpodobnost. Někdy lze pravděpodobnost lépe vypočítat, pokud si jediný náhodný jev rozdělíme do několika skupin. Příklad 6 Máme dva klobouky, v prvním i ve druhém je 5 kuliček černých a 5 bílých. Z prvního klobouku vyndáme kuličku (nepodíváme se na ni) a dáme ji do druhého. Z druhého klobouku vyndáme kuličku. Jaká je pravděpodobnost, že je bílá? Ptáme se nejprve, co se mohlo stát, pokud kulička vytažená ze 2. klobouku byla bílá. Můžeme vyslovit dvě hypotézy: Hc (z prvního do druhého klobouku jsme přendali černou kuličku) a Hf, (z prvního do druhého klobouku jsme přendali bílou kuličku. Je vhodné si situaci rozložit na dvě disjuktní množiny: přenám-li černou kuličku, bude pravděpodobnost, že ze druhého klobouku vytáhnu bílou, rovna přendám-li bílou, bude tato pravděpodobnost rovna jj. Každý z obou případů může nastat se stejnou pravděpodobností, neboť bílých a černých kuliček je v prvním klobouku stejně. Dohromady tedy je pravděpodobnost toho, že vytáhnu blou kuličku, rovna , . 5 5 5 6 P(B) =--+--. v ' 1011 10 11 Analogicky pak postupujeme, když si situaci rozložíme na n disjunktních podmnožin, tedy: P(A) = P(B1)P(A\B1) + P(B2)P(A\B2) + • • • + P(Bn)P(A\Bn) První Bayesova věta odpovídá na otázku, jaká je pravděpodobnost, že nastal jev Hi, víme-li, že nastal jev A: (Známe celkovou pravděpodobnost jevu A, vypočtenou podle vzorce pro úplnou pravděpodobnost, a chceme znát pravděpodobnost, že nastala jedna z hypotéz, nastal-li jev A.) 6 Druhá Bayesova věta odpovídá na otázku, jaká je pravděpodobnost, že nastal jev H, víme-li, že nastal jev A: pmiA, = T,nk=iP(Hk)P(A\Hk)P(B\AnHk) [ ' ' Yľk=lP{Hk)P{A\Hk) (V tomto vzorci nás navenek nezajímají pravděpodobnosti jednotlivých hypotéz, počítáme pouze pravděpodobnost jevu B za podmínky, že nastal jev A. Hypotézy vstupují do hry pouze za účelem usměrnění našeho uvažování.) 5 Nezávislé jevy Z klasické definice pravděpodobnosti víme, že P{ADB) = |íí| Problém: jak určit \A D b\, pokud nechci vypisovat všechny možnosti?? Ze vzorce pro klasickou pravděpodobnost při našem běžném označení plyne, že PiA\B)~PtAnB> P(B) odkud jednoduchou úpravou dostáváme P(Ar\B) = P(A\B)P(B) a analogicky P(Ar\B) =P(B\A)P(A) (Tyto vztahy platí vždy - je to tzv. věta o násobení pravděpodobností.) Pro pravděpodobnost průniku 3 a více jevů A±, a2,..., An pak platí: p(a1 n a2 n... n an) = p{a1)p{a2\a1) ■ ■ ■ P(An|Ai n a2 n... n an^) Uvědomíme si nyní, jak definujeme nezávislé jevy slovně: říkáme, že pravděpodobnost jevu A nezávisí na jevu B a naopak; tedy pravděpodobnost, že nastane jev A je táž jako pravděpodobnost toho, že nastane jev A, nastal-li jev B (a naopak). Vyjádříme-li toto tvrzení formálně, dostáváme definici: Definice 7 (Nezávislé jevy) Říkáme, že jev a nezávisí na jevu b, pokuá platí p(a\b) = p{a) (a pak teáy také p(b\a) = p(b)). 7 Zřejmě potom platí, že P {A n B) = P{Ä)P{B). Nechť je dán základní prostor $1, jev A a jev B. Pravděpodobnost toho, že za podmínky B nastal jev A, vypočteme takto: PiA\B)~PtAnB> P(B) Např. fž{l, 2, 3,4, 5, 6} - výsledky hodu kostkou jev A = {3,4, 5, 6} - padne číslo větší než 2 jev B = {1, 6} - padne 1 nebo 6 P(A) = 2-,P{B) = l-P{A\B) = \_=\ 6 Zajímavé úlohy Rytíř de Méré byl hazardní hráč, který své domněnky sděloval Pascalovi nebo Fermatovi (OVĚŘ). Některé z domněnek byly správné, jiné nesprávné. Úloha rytíře de Méré č. 1 (o házení třemi kostkami): Házíme-li třemi kostkami současně, je pravděpodobnost, že součet ok na všech kostkách bude 11 stejná jako pravděpodobnost toho, že součet ok na všech kostkách bude 12. Praxe hazardního hráče to však nepotvrzuje. Neboli: co je špatně na této úvaze? Součet 12 dostaneme ze tří sčítanců od 1 do 6 šesti způsoby: 6+5+1; 6+4+2; 6+3+3; 5+5+2; 5+4+3; 4+4+4; analogicky součet 11 dostaneme ze tří sčítanců od 1 do 6 také šesti způsoby: 6+4+1; 6+3+2; 5+5+1; 5+4+2; 5+4+2; 4+4+3. Řešení: součet 6+3+2 padá šestkrát častěji než součet 4+4+4, součet 5+5+1 padá třikrát častěji než součet 4+4+4. (Ověřte si prakticky.) Úloha rytíře de Méré č. 2 (o házení jednou kostkou): Chceme-li hodit aspoň jednu šestku při opakovaném házení kostkou, máme nadpoloviční pravděpodobnost počínaje čtyřmi hody. Je to pravda? Řešení: při jednom hodu je pravděpodobnost, že padne šestka, rovna fraclQ. Analogicky pro více hodů - šestka padne nejpozději: • druhým hodem: | • 1 + || = || • třetím hodem: l ■ l + 11 + lil = 6 ooooo 216 • čtvrtým hodem- - ■ 1 -U ^i -U 5 5 1 5 5 5 1 _ 671 > 1 • cwnym nouem. 6 i-|-66-|-666i-6666 — 1296 > 2 8 Buffonova úloha o jehle: Rovina je rozdělena stejně od sebe vzdálenými rovnoběžkami. Hodíme na ni jehlu menší než je vzdálenost rovnoběžek. Jaká je pravděpodobnost, že jehla protne některou rovnoběžku, jestliže každou polohu jehly považujeme za stejně nadějnou? [21/ird, kde l je délka jehly a d vzdálenost rovnoběžek] 7 Popisná statistika Kdy nestačí klasická definice pravděpodobnosti? - geometrická pravděpodobnost je jen model klasické pravděpodobnosti - podstatné pro klasickou pravděpodobnost je toto: nastoupení lib. jevu má stejnou možnost, tj. žádný jev nemá přednost před ostatními Jinými slovy, klasickou definici pravděpodobnosti můžeme použít, pokud předem dokážeme popsat všechny možnosti, které mohou nastat, a s jakou pravděpodobností (můžeme pravděpodobnost určit a priori). V takovém případě můžeme také vždy odhadnout pravděpodobnost na základě opakování náhodného pokusu: házíme-li kostkou delší dobu, všechna čísla budou padat přibližně stejně často. Statistická definice pravděpodobnosti - nazývaná také frekvenční či empirická (určená na základě pozorování - a posteriori). Opakujeme-li n-krát nezávisle daný pokus a nastane-li v těchto pokusech sledovaný jev A m-krát, potom jeho relativní četnost je rovna zlomku m/n. Bude-li při rostoucím počtu pokusů relativní četnost kolísat ve stále užších mezích kolem určitého čísla, můžeme předpokládat, že toto číslo je pravděpodobností jevu A. - absolutní četnost - relativní četnost Náhodná veličina nám dovoluje zavést funkce a posléze popisovat náhodné děje pomocí těchto funkcí. Může být diskrétní (počet šestek při hodu šesti kostakmi; počet líců při určitém počtu hodu mincí) nebo spojitá (výška postavy náhodně vybraného člověka, ...). Lze také říci, že to je funkce, která každému jevu přiřadí reálné číslo. Distribuční funkce • neklesající • zprava spojitá • lim^oo ${x) = 1, linx^-oo ${x) = 0 • 0 < $(x) < 1 9 • pro xq £ M platí: P{X = x) = ${xq) — ^mx^,x - (a) Diskrétní náhodná veličina • pravděpodobnostní funkce tt{x) — nezáporná — normovaná, tj. Yl^oo71^) = 1 • distribuční funkce: p{G1)+p{G2) . p(GiUG2)+0 P(G2 \ G2) = p(G2) - • G1 CG2^p(G1)