Matematika IV - 7. přednáška Pravděpodobnost - opakování a zobecnění pojmů Michal Bulant Masarykova univerzita Fakulta informatiky 7. 4. 2008 = O Pravděpodobnost nebo statistika? Q Pravděpodobnost Q Náhodné veličiny • Martin Panák, Jan Slovák, Drsná matematika, e-text. • Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická statistika, Matfyzpress, 4. vydání, 2006, 230 stran, ISBN 80-867-3271-1. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. • Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Popisná statistika, Masarykova univerzita, 3. vydání, 2002, 48 stran, ISBN 80-210-1831-3. • Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Ě-jrmmrimm oooooooooooooooo lán přednášky Pravděpodobnost nebo statistika? □ g - = -E-OQ^O" Motto 42,35 procenta všech statistik je nesmyslných. Statistika v širším slova smyslu je jakékoliv zpracování číselných dat o nějakém souboru objektů a jejich více či méně přehledná prezentace. Podstatou matematické statistiky je pro daná data zjišťovat, jaké vlastnosti mají objekty, které jsou daty popisovány. Zpravidla jde o sběr dat o části souboru objektů, jejich následnou analýzu a konečně o vyslovení důsledků pozorování pro celý soubor. Podstatou matematické statistiky je pro daná data zjišťovat, jaké vlastnosti mají objekty, které jsou daty popisovány. Zpravidla jde o sběr dat o části souboru objektů, jejich následnou analýzu a konečně o vyslovení důsledků pozorování pro celý soubor. Výsledkem práce matematického statistika je sdělení o velkém souboru objektů na základě studia malé (zpravidla náhodně vybrané) části z nich, společně s kvalitativním odhadem věrohodnosti výsledného sdělení. Podstatou matematické statistiky je pro daná data zjišťovat, jaké vlastnosti mají objekty, které jsou daty popisovány. Zpravidla jde o sběr dat o části souboru objektů, jejich následnou analýzu a konečně o vyslovení důsledků pozorování pro celý soubor. Výsledkem práce matematického statistika je sdělení o velkém souboru objektů na základě studia malé (zpravidla náhodně vybrané) části z nich, společně s kvalitativním odhadem věrohodnosti výsledného sdělení. Teorie pravděpodobnosti studuje modely popisující chování abstraktních souborů (pravděpodobnost jevů zjevového pole), statistika studuje skutečné náhodné výběry z nějakého základního souboru a zdůvodňuje výběr teoretického pravděpodobnostního modelu, resp. kvalitativní informace o jeho parametrech. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III, jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III, jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, 9 průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IBOOO - 2, 95; IB102 - 2, 89) a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III, jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IB000 - 2, 95; IB102 - 2, 89) , O nejčastější známku (resp. úspěšnou známku) z tohoto předmětu (F - 92 krát, E - 91 krát), nejméně častou známku (B - 15 krát), a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III, jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IB000 - 2, 95; IB102 - 2, 89) , O nejčastější známku (resp. úspěšnou známku) z tohoto předmětu (F - 92 krát, E - 91 krát), nejméně častou známku (B - 15 krát), O průměrný počet bodů dosažených na jednotlivých termínech zkoušky (1. - 16,8; 2. - 8,9; 3. - 8,1; příklad, za nějž bylo uděleno nejvíce (nejméně) procent možných bodů - min. kostra (IB, 82,5%), resp. rekurence (2A, 3,6%) a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III, jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IB000 - 2, 95; IB102 - 2, 89) , O nejčastější známku (resp. úspěšnou známku) z tohoto předmětu (F - 92 krát, E - 91 krát), nejméně častou známku (B - 15 krát), O průměrný počet bodů dosažených na jednotlivých termínech zkoušky (1. - 16,8; 2. - 8,9; 3. - 8,1; příklad, za nějž bylo uděleno nejvíce (nejméně) procent možných bodů - min. kostra (IB, 82,5%), resp. rekurence (2A, 3,6%) 9 počet pracovních hodin týdně odpracovaných mimo fakultu, a mnoho dalších údajů. Příklad Za soubor objektů vezměme všechny studenty přednášky Matematika III, jako číselný údaj můžeme uvažovat O průměrné bodové hodnocení studenta u zkoušky, O průměrnou známku u zkoušky z tohoto (2,92 ) a z jiných pevně vybraných předmětů (IB000 - 2, 95; IB102 - 2, 89) , O nejčastější známku (resp. úspěšnou známku) z tohoto předmětu (F - 92 krát, E - 91 krát), nejméně častou známku (B - 15 krát), O průměrný počet bodů dosažených na jednotlivých termínech zkoušky (1. - 16,8; 2. - 8,9; 3. - 8,1; příklad, za nějž bylo uděleno nejvíce (nejméně) procent možných bodů - min. kostra (IB, 82,5%), resp. rekurence (2A, 3,6%) O počet pracovních hodin týdně odpracovaných mimo fakultu, O číselná data vypovídající o historii dřívějšího studia a mnoho dalších údajů. Zastavme se u prvního údaje. Samotný aritmetický průměr bodů nám mnoho neřekne nejen o kvalitě přednášky a o kvalitě přednášejícího, ale ani o samotném hodnocení. Zajímá nás také hodnota, která bude „uprostřed souboru", tj. počet bodů, pro které je stejně studentů pod ní a nad ní. Obdobně první a poslední čtvrtina, desetina apod. Všem takovým údajům říkáme statistiky posuzované veličiny. V uvedených příkladech se jim říká medián, kvartil, decil apod. Zastavme se u prvního údaje. Samotný aritmetický průměr bodů nám mnoho neřekne nejen o kvalitě přednášky a o kvalitě přednášejícího, ale ani o samotném hodnocení. Zajímá nás také hodnota, která bude „uprostřed souboru", tj. počet bodů, pro které je stejně studentů pod ní a nad ní. Obdobně první a poslední čtvrtina, desetina apod. Všem takovým údajům říkáme statistiky posuzované veličiny. V uvedených příkladech se jim říká medián, kvartil, decil apod. Z obecné zkušenosti nebo jako výsledek úvah mimo matematiku víme, že rozumné hodnocení by na mělo mít tzv. normální rozdělení (odpovídá tzv. Gaussově křivce). Tento pojem patří do teorie pravděpodobnosti a k jeho zavedení potřebujeme poměrně dost matematiky. Zastavme se u prvního údaje. Samotný aritmetický průměr bodů nám mnoho neřekne nejen o kvalitě přednášky a o kvalitě přednášejícího, ale ani o samotném hodnocení. Zajímá nás také hodnota, která bude „uprostřed souboru", tj. počet bodů, pro které je stejně studentů pod ní a nad ní. Obdobně první a poslední čtvrtina, desetina apod. Všem takovým údajům říkáme statistiky posuzované veličiny. V uvedených příkladech se jim říká medián, kvartil, decil apod. Z obecné zkušenosti nebo jako výsledek úvah mimo matematiku víme, že rozumné hodnocení by na mělo mít tzv. normální rozdělení (odpovídá tzv. Gaussově křivce). Tento pojem patří do teorie pravděpodobnosti a k jeho zavedení potřebujeme poměrně dost matematiky. Porovnáním výsledku třeba i docela malého náhodného výběru studentů s teoretickým modelem můžeme zjistit odhad parametrů takového rozdělení a činit závěry, zda je hodnocení „rozumné". Zároveň lze popsat věrohodnost našich závěrů. Daleko zajímavější vývody ovšem můžeme činit, když porovnáním statistik pro různé veličiny budeme moci dovozovat informace o souvislostech. Pokud např. neexistuje žádná doložitelna souvislost mezi historií předchozího studia a výsledky v dané přednášce, je jedním z možných vysvětlení vývod, zeje přednáška (nebo její hodnocení) prostě špatná. Daleko zajímavější vývody ovšem můžeme činit, když porovnáním statistik pro různé veličiny budeme moci dovozovat informace o souvislostech. Pokud např. neexistuje žádná doložitelna souvislost mezi historií předchozího studia a výsledky v dané přednášce, je jedním z možných vysvětlení vývod, zeje přednáška (nebo její hodnocení) prostě špatná. Závěr úvodních úvah: • V matematice pracujeme s abstraktním matematickým popisem pravděpodobnosti. • Vývody pro konktrétní soubory dat, pro které je zvolený model relevantní dává matematická statistika. • To, zda je takový popis adekvátní pro konkrétní výběr dat, je také možné podpořit nebo zavrhnout pomocí metod matematické statistiky. oooooooooooooooo Plan přednášky Q Pravděpodobnost □ s ~ = ■€. -o<\(y Připomeneme (a trochu zobecníme) pojmy a výsledky z prvního semestru. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Připomeneme (a trochu zobecníme) pojmy a výsledky z prvního semestru. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Prvky wefi představují jednotlivé možné výsledky. Připomeneme (a trochu zobecníme) pojmy a výsledky z prvního semestru. Budeme pracovat s neprázdnou pevně zvolenou množinou Q všech možných výsledků, kterou nazýváme základní prostor. Prvky wefi představují jednotlivé možné výsledky. Systém podmnožin A základního prostoru se nazývá jevové pole a jeho prvky se nazývají jevy, jestliže • Q G A, tj. základní prostor, je jevem, • je-li A, B E A, pak A \ B G A, tj. pro každé dva jevy je jevem i jejich množinový rozdíl, • je-li A j G A, i G / nejvýše spočetný systém jevů, pak také jejich sjednocení je jevem, tj. U,-e/>4; G A. Důsledek • Komplement Ac = Q \ A jevu A je jevem, který nazýváme opačný jev k jevu A. srovnej s pojmem množinová algebra v části o Booleovských algebrách, a zde znamená spočetnost. ' Důsledek * 9 Komplement Ac = Q \ A jevu A je jevem, opačný jev k jevu A. 9 Průnik dvou jevů opět jevem, protože pro podmnožiny A, B C Q platí A\(Q\B) = AnB. který nazýváme každé dvě ----------------------------' Takový systém množin A se pak nazývá cr-algebra 1 srovnej s pojmem množinová algebra v části o Booleovských algebrách, a zde znamená spocetnost. ' Důsledek * 9 Komplement Ac = Q \ A jevu A je jevem, opačný jev k jevu A. 9 Průnik dvou jevů opět jevem, protože pro podmnožiny A, B C Q platí A\(Q\B) = AnB. který nazýváme každé dvě ----------------------------' Takový systém množin A se pak nazývá cr-algebra 1 Jevové poleje tedy systém podmnožin základního prostoru uzavřený na konečné průniky, spočetná sjednocení a množinové rozdíly. Jednotlivé množiny A G A nazýváme náhodné jevy (vzhledem k .4). srovnej s pojmem množinová algebra v části o Booleovských algebrách, a zde znamená spocetnost. Terminologie připomíná souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, Terminologie připomíná souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, Terminologie pripomína souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, • společné nastoupení jevů A,, i g /, odpovídá jevu n,e/4/, nastoupení alespoň jednoho z jevů A,, i g /, odpovídá jevu Terminologie pripomína souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, • společné nastoupení jevů A,, i g /, odpovídá jevu n,e/4/, nastoupení alespoň jednoho z jevů A,, i g /, odpovídá jevu • A, B e A jsou neslučitelné jevy, je-li A n B = 0, Terminologie pripomína souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, • společné nastoupení jevů A,, i g /, odpovídá jevu n,e/4/, nastoupení alespoň jednoho z jevů A,, i g /, odpovídá jevu • A, B e A jsou neslučitelné jevy, je-li A n B = 0, • jev A má za důsledek jev B, když A c B, Terminologie pripomína souvislosti s popisem skutečných jevů a jejich statistickým popisem: • celý základní prostor Q se nazývá jistý jev, prázdná podmnožina 0 G A se nazývá nemožný jev, • jednoprvkové podmnožiny {co} G Q se nazývají elementární jevy, • společné nastoupení jevů Aj, i g /, odpovídá jevu n,e/4/, nastoupení alespoň jednoho z jevů A,, i G /, odpovídá jevu • A, B e A jsou neslučitelné jevy, je-li A n B = 0, • jev A má za důsledek jev B, když A c B, • je-li A G A, pak se jev B = Q \ A nazývá opačný jev k jevu A, píšeme B = Ac. Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = Yliel P(Ai)> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,„4). □ s Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = Yliei ^(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,„4). Důsledek Pro všechny jevy A, B e A platí • p(0) = 0, 0 < P(A) < 1, Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = Yliei ^(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,„4). Důsledek Pro všechny jevy A, B e A platí • P(0) = 0, 0 < P(A) < 1, • P{AC) = 1 - P{A), Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = Yliei ^(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,„4). Důsledek Pro všechny jevy A, B e A platí • P(0) = 0, 0 < P(A) < 1, • P{AC) = 1 - P{A), *ACB^ P{A) < P{B), P{B \ A) P{B) - P(A), Definice (Kolmogorovova definice pravděpodobnosti) Pravděpodobnostní prostor je jevové pole A podmnožin (konečného) základního prostoru Q, na kterém je definována funkce P : A —> M s následujícími vlastnosti: • je nezáporná, tj. P (A) > 0 pro všechny jevy A, • je aditivní, tj. P(U;e/A) = Yliei ^(A')> Pro každý nejvýše spočetný systém po dvou neslučitelných jevů, • pravděpodobnost jistého jevu je 1. Funkci P nazýváme pravděpodobností na jevovém poli (Q,„4). Důsledek Pro všechny jevy A, B e A platí • P(0) = 0, 0 < P(A) < 1, • P{AC) = 1 - P{A), *ACB^ P{A) < P{B), P{B \A) = P{B) » P{A U ß) = P{A) + P(ß) - P{A n ß) P(A), Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Tvrzení Pro libovolnou nejvýše spočetnou množinu jevů (A)/^i platí: 9 Je-liA1CA2<^---,pak P((JA) = lim P(A), 1=1 □ g - = Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Tvrzení Pro libovolnou nejvýše spočetnou množinu jevů (A')/^i platí: 9 Je-liA1CA2<^---,pak oo P(I)A)= lim P(Ai), (=1 • Je-li A1^A2^---,pak oo P(f]Ai)= lim P(Aj), ' ' i—>oo 1=1 □ g - = -e-OQ^O" Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Pro libovolnou nejvýše spočetnou 9 Je-liA1CA2<^---,pak množinu jevů (Ai)ti platí: oo 1=1 = lim i—too P(Ai), • Je-li A-í ^A2 D ■ •, pak oo p(f)Ai) ;=1 = lim /—>oo P(A,), • PiUZi Ai)< J2T=x p{Aí), □ 3 - = -^ -T)c\(y Podobná tvrzení platí i pro nekonečné posloupnosti jevů: Pro libovolnou nejvýše spočetnou množinu jevů (A-)^i platí: a Je-li Ax a2c- ••, pak oo í=i = lim i—too P(A), • Je-li Ax 5 A> 3 • ••, pak oo ;=i = lim /—>oo KA), • PiUZi A) < ESi P(A), • P(f)Zi A) > i - E~i(i- P(A)) □ 3 - = -^ -o^O" ooooo«oooooooooo Klasi' Připomeňme si klasickou konečnou pravděpodobnost. Pravdepodobnos OOOOO nebo tatistika? Pravděpodobnost ooooo«oooooooooo Náhodne veličiny oooooooo Klasickí í pr avděpodobi nost Připomeňme si klasickou konečnou pravděpodobnost. Definice Nechť Q je konečný základní prostor a nechť jevové pole A je právě systém všech podmnožin v Q. Klasická pravděpodobnost je pravděpodobnostní prostor (Q,A, P) s pravděpodobnostní funkcí P : A -»■ M, Zjevně takto zadaná funkce skutečně definuje pravděpodobnost, kdy všem elementárním jevům přiřazujeme stejnou pravděpodobnost. Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu uox slovně vyjádřeného: ztracená písemka se nachází nejblíže k zastávce trolejbusu X. Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu uox slovně vyjádřeného: ztracená písemka se nachází nejblíže k zastávce trolejbusu X. • Určete pravděpodobnost, jevu w^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu uox slovně vyjádřeného: ztracená písemka se nachází nejblíže k zastávce trolejbusu X. • Určete pravděpodobnost, jevu w^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. Že s klasickou pravděpodobností nevystačíme, ukazují následující příklady: Příklad • Cestou z Kotlářské na Botanickou jsem ztratil zadání písemky. Určete pravděpodobnost jevu uox slovně vyjádřeného: ztracená písemka se nachází nejblíže k zastávce trolejbusu X. • Určete pravděpodobnost, jevu w^: při opakovaném hodu mincí padne hlava poprvé při k-tém pokusu. V prvním případě je třeba pracovat s nekonečně mnoha stejně pravděpodobnými elementárními jevy: písemku jsem ztratil v bodě (x,y) , ve druhém pak musíme připustit teoretickou možnost, že hlava nepadne nikdy, a prostorem jevů tedy bude N U {oo}. Typický příklad klasické pravděpodobnosti jsou jevy související s házením mincí. Představme si následující pravidla kasina: Typický příklad klasické pravděpodobnosti jsou jevy související s házením mincí. Představme si následující pravidla kasina: Návštěvník zaplatí vklad C a poté hází mincí. V banku je na začátku dolar a při každém hodu se bank zdvojnásobí. Padne-li hlava, hráč získá obsah banku. Je-li tedy T počet hodů potřebných k první hlavě, hráč obdrží výhru 2T. Jaká je „fér hodnota" pro vklad C? Typický příklad klasické pravděpodobnosti jsou jevy související s házením mincí. Představme si následující pravidla kasina: Návštěvník zaplatí vklad C a poté hází mincí. V banku je na začátku dolar a při každém hodu se bank zdvojnásobí. Padne-li hlava, hráč získá obsah banku. Je-li tedy T počet hodů potřebných k první hlavě, hráč obdrží výhru 2T. Jaká je „fér hodnota" pro vklad C?_____________________________________________________ A co vy? Zaplatili byste za možnost zahrát si tuto hru třeba 20$? Pravděpodobnost, že padne hlava je u férové mince 1/2, je proto P{T = k) = 2~k. Sečteme-li všechny pravděpodobnosti výsledků vynásobených výhrami 2k, dostaneme očekávanou výhru 1 Zdá se proto, že se vyplatí vložit i velký vklad, protože libovolný vklad C se nám ,,časem" vrátí. Pravděpodobnost, že padne hlava je u férové mince 1/2, je proto P{T = k) = 2~k. Sečteme-li všechny pravděpodobnosti výsledků vynásobených výhrami 2k, dostaneme očekávanou výhru 1 Zdá se proto, že se vyplatí vložit i velký vklad, protože libovolný vklad C se nám ,,časem" vrátí. Ve skutečnosti simulací hry zjistíme, že nezávisle na počtu pokusů se prakticky všechny výhry budou pohybovat v rozmezí malých hodnot. Důvodem je, že vysoké výhry jsou velice nepravděpodobné a proto je při reálných úvahách nelze brát vážně. Pravděpodobnost, že padne hlava je u férové mince 1/2, je proto P{T = k) = 2~k. Sečteme-li všechny pravděpodobnosti výsledků vynásobených výhrami 2k, dostaneme očekávanou výhru 1 Zdá se proto, že se vyplatí vložit i velký vklad, protože libovolný vklad C se nám ,,časem" vrátí. Ve skutečnosti simulací hry zjistíme, že nezávisle na počtu pokusů se prakticky všechny výhry budou pohybovat v rozmezí malých hodnot. Důvodem je, že vysoké výhry jsou velice nepravděpodobné a proto je při reálných úvahách nelze brát vážně. Tento paradox je vysvětlován nelinearitou funkce užitečnosti peněz (utility function), případně nezbytností diskontovaní jejich hodnoty. Pravděpodobnost nebo statistika? Pravděpodobnost Náhodne veličiny ooooo ooooooooo«oooooo oooooooo Podmíněná pravděpodobnost a nezávislost Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. ooooooooo«oooooo t a nezávislos Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? ooooooooo«oooooo t a nezávislos Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? • Mějme urnu s 10 koulemi. Desetkrát jsem vytáhl kouli, zkontroloval její barvu a vrátil do urny. Jestliže byla vždy bílé barvy, s jakou pravděpodobností jsou všechny koule v urně bílé? ooooooooo«oooooo t a nezávislos Je dokázáno, že slavení narozenin je zdraví prospěšné. Statistika ukazuje, že lidé, kteří oslavili nejvíce narozenin, se dožívají nejvyššího věku. Obvyklé je také klást dotazy s dodatečnou podmínkou. Např. • Jaká je pravděpodobnost, že při hodu dvěma kostkami padly dvě pětky, je-li součet hodnot deset? • Mějme urnu s 10 koulemi. Desetkrát jsem vytáhl kouli, zkontroloval její barvu a vrátil do urny. Jestliže byla vždy bílé barvy, s jakou pravděpodobností jsou všechny koule v urně bílé? • Na dostizích jsou známy pravděpodobnosti vítězství jednotlivých koní. Jak se tyto pravděpodobnosti změní, pokud uprostřed závodu spadne jezdec jednoho z koní ze sedla? Připomeneme, že formalizovat takové úvahy umíme následovně. Definice Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P{A\H) jevu A e A vzhledem k jevu H je definována vztahem P{A\H) P(A n H) = Připomeneme, že formalizovat takové úvahy umíme následovně. Definice Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P{A\H) jevu A e A vzhledem k jevu H je definována vztahem P{A\H) P(A n H) Přirozená definice nezávislosti je, že hypotéza H a jev A jsou nezávislé tehdy, je-li P (A) = P(A\H). Z výše uvedeného snadno vyplývá symetričtější definice: = Pravděpodobnost OOOOOOOOOO0OOOOO Připomeneme, že formalizovat takové úvahy umíme následovně. Definice Nechť H je jev s nenulovou pravděpodobností v jevovém poli A v pravděpodobnostním prostoru (Q,A,P). Podmíněná pravděpodobnost P{A\H) jevu A e A vzhledem k jevu H je definována vztahem P{A\H) P(A n H) Přirozená definice nezávislosti je, že hypotéza H a jev A jsou nezávislé tehdy, je-li P (A) = P(A\H). Z výše uvedeného snadno vyplývá symetričtější definice: Definice Říkáme, že jevy A a B jsou nezávislé, jestliže P(AnB) = P(A)P(B). Definice Říkáme, že jevy -4i,42,... jsou nezávislé, jestliže pro každou /c-tici Aji; ■ ■ ■ , Ajk z nich platí p rn=nw- u=i 7=1 □ S - = =: -f)<\(> Definice Říkáme, že jevy -4i,42,... jsou nezávislé, jestliže pro každou /c-tici Aji; ■ ■ ■ , Ajk z nich platí p rn=nw- u=i 7=1 Příklad V urně jsou 4 lístky označené 000, 110, 101, 011. Uvažujme pro / = 1, 2, 3 náhodné jevy A; = {náhodně vytažený lístek má na /-tém místě 1}. Definice Říkáme, že jevy A\,A2,... jsou nezávislé, jestliže pro každou /c-tici Aji; ■ ■ ■ , Ajk z nich platí p rn=nw- u=i 7=1 Příklad V urně jsou 4 lístky označené 000, 110, 101, 011. Uvažujme pro / = 1, 2, 3 náhodné jevy A; = {náhodně vytažený lístek má na /-tém místě 1}. Snadno se vidí, že P{AX) = P(A2) = P(A3) = \, dále, že P{A1 n A2) = P(Ax n A3) = P(A2 n A3) = | P{AX n A2 n 43) = 0. a ze Definice Říkáme, že jevy A\,A2,... jsou nezávislé, jestliže pro každou /c-tici Aji; ■ ■ ■ , Ajk z nich platí p rn=nw- u=i 7=1 Příklad V urně jsou 4 lístky označené 000, 110, 101, 011. Uvažujme pro / = 1, 2, 3 náhodné jevy A; = {náhodně vytažený lístek má na /-tém místě 1}. Snadno se vidí, že P{AX) = P(A2) = P(A3) = \, dále, že P{Ai n A2) = P{AX n A3) = P{A2 n A3) = \ a že P{A\ n A2 n ^3) = 0. Jevy A\,A2, A3 jsou tedy po dvou nezávislé, ale nejsou nezávislé. OOOOOOOOOOOO0OOO Baye: ■£■ Přepsáním formule pro podmíněnou pravděpodobnost dostáváme P(AnB) = P(BnA) = P{A)P{B\A) = P{B)P{A\B). Věta (Bayesovy věty) Pro pravděpodobnost jevů A a B platí op(A\B) = f^gw. Q p(A\B) - ______P(A)P(B\A)_____ OOOOOOOOOOOO0OOO Baye: ■£■ Přepsáním formule pro podmíněnou pravděpodobnost dostáváme P(AnB) = P(BnA) = P{A)P{B\A) = P{B)P{A\B). Věta (Bayesovy věty) Pro pravděpodobnost jevů A a B platí op(A\B) = f^gw. Q p(A\B) - ______P(A)P(B\A)_____ První tvrzení je přepsáním předchozí formule, druhé z prvého plyne doszením P(B) = P{A)P{B\A) + P{AC)P{B\AC). D Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Náhodně z populace výběrem osobu a otestujeme pozitivně. S jakou pravděpodobností je skutečně HIV pozitvní, jestliže četnost výskytu HIV v populaci je p promile (tj. p osob z tisíce je skutečně HIV pozitivní). 0000000000000*00 Příkls id - preventivní screenii ng Předpokládejme, že krevní test na HIV pozitivní osoby má 99% správnost v případě osoby skutečně HIV pozitivní (vysoká citilivost -sensitivity). Zároveň předpokládejme, že u HIV negativní osoby dopadne test pozitivně v 0,2% případů (relativně vysoká specifičnost - specificity). Náhodně z populace výběrem osobu a otestujeme pozitivně. S jakou pravděpodobností je skutečně HIV pozitvní, jestliže četnost výskytu HIV v populaci je p promile (tj. p osob z tisíce je skutečně HIV pozitivní). Označme A jev, že je daná osoba HIV pozitivní, a B jev, že daná osoba má pozitivní test. Dle druhé Bayesovy věty je hledaná pravděpodobnost P(A\B) p/1000•99/100 p/1000 • 99/100 + (1000 - p)/1000 • 2/1000 Jestliže zvolíme za p nějaké konkrétní četnosti, dostaneme příslušné očekávatelné spolehlivosti testu. V následující tabulce je spočten výsledek pro několik p: P 100 10 1 0,1 P(A\B) 0,982 0,8333 0,3313 0,0471 Výsledek asi neodpovídá naší intuici a může se zdát šokující ve vztahu k použití takovýchto testů. oooooooooooooo»o Příkls d - preventivní screen ng, pokr. Jestliže zvolíme za p nějaké konkrétní četnosti, dostaneme příslušné očekávatelné spolehlivosti testu. V následující tabulce je spočten výsledek pro několik p: P 100 10 1 0,1 P(A\B) 0,982 0,8333 0,3313 0,0471 Výsledek asi neodpovídá naší intuici a může se zdát šokující ve vztahu k použití takovýchto testů. Poznámka Sami si můžete podobný výpočet udělat pro tzv. triple test na Downův syndrom, prováděný ve 2. trimestru těhotenství s 90% citlivostí a 5% ,,false-positive rate" či pro statistiky svého oblíbeného spamfilteru (např. SpamAssassin s někde udávanou citlivostí 99,64% a specifičností 98.23%). Evidentně prostý výběr náhodné osoby a použití jediného testu, byť velmi citlivého a specifického, nejsou vhodné ani na otestování skutečného stavu populace, ani na preventivní vyšetření jednotlivců, pokud nemáme další podpůrné informace a lepší nástroje. Evidentně prostý výběr náhodné osoby a použití jediného testu, byť velmi citlivého a specifického, nejsou vhodné ani na otestování skutečného stavu populace, ani na preventivní vyšetření jednotlivců, pokud nemáme další podpůrné informace a lepší nástroje. Právě matematická statistika dává nástroje na kvalifikovanější postupy v medicínské i průmyslové diagnostice, ekonomických modelech, vyhodnocování experimentálních dat atd. Plan přednášky oooooooooooooooo Náhodné veličiny □ g - = -E-OQ^O" Vratme se k jednoduchému a názornému příkladu statistik kolem výsledků studentů v daném předmětu, který je a není podobný klasické pravděpodobnosti a s ní související statistice při házení kostkou. Vratme se k jednoduchému a názornému příkladu statistik kolem výsledků studentů v daném předmětu, který je a není podobný klasické pravděpodobnosti a s ní související statistice při házení kostkou. Na jedné straně jsme připustili pouze konečný počet možných bodových hodnocení (celá čísla od 0 do 30), zároveň ale není patrně vhodné představovat si výsledky jednotlivých studentů jako analogii nezávislého házení kostkou (to by byla skutečně divně vedená přednáška). Vratme se k jednoduchému a názornému příkladu statistik kolem výsledků studentů v daném předmětu, který je a není podobný klasické pravděpodobnosti a s ní související statistice při házení kostkou. Na jedné straně jsme připustili pouze konečný počet možných bodových hodnocení (celá čísla od 0 do 30), zároveň ale není patrně vhodné představovat si výsledky jednotlivých studentů jako analogii nezávislého házení kostkou (to by byla skutečně divně vedená přednáška). Místo toho máme na základním prostoru Q všech studentů definovánu funkci bodového ohodnocení X : Q —► R. Je to typický příklad náhodné veličiny. U každé náhodné veličiny potřebujeme umět pracovat s vhodnou množinou jevů. Zpravidla požadujeme, abychom mohli pracovat s pravděpodobnostmi příslušnosti hodnoty X do předem zadaného intervalu. Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, • počet bakterií v daném množství roztoku nebo Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, • počet bakterií v daném množství roztoku nebo • počet studentů, kteří uspěli u zkoušky. Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, • počet bakterií v daném množství roztoku nebo • počet studentů, kteří uspěli u zkoušky. Přirozenější interpretací výsledku pokusu je totiž často spise než zjištění, zda náhodný jev nastal či nenastal, nějaká hodnota: • součet bodů na dvou kostkách, • počet bakterií v daném množství roztoku nebo • počet studentů, kteří uspěli u zkoušky. Od pravděpodobnostního prostoru (Q,A, P) tedy potřebujeme přejít k obdobné dvojici (R, 3) tak, abychom podmnožinám R, ležícím v cr-algebře B byli schopni přiřadit pravděpodobnost odvozenou z (Q, A, P). Na prostoru R uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Na prostoru R uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Na prostoru Rfc uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Definice Náhodná veličina je taková funkce X každou Borelovskou borelovsky měřitelní Množinová funkce X na pravděpodobnostním prostoru (Q,A, P) Q -► R, že vzor X~1{B) patří do A pro množinu B G B na R (tj. X : Q -► R je tzv. 0- PX(B) = PiX-1 (B)) se nazývá rozdělen ' pravděpodobnost náhodné veličiny X. Na prostoru Rfc uvažujme nejmenší jevové pole B obsahující všechny /(-rozměrné intervaly. Množinám v B říkáme borelovske množiny (nebo také měřitelné množiny) na Rfc. Speciálně pro k = 1 jde o množiny, které obdržíme z intervalů konečnými průniky a nejvýše spočetnými sjednoceními. Definice Náhodná veličina X na pravděpodobnostním prostoru (Q,A, P) je taková funkce X : Q —> R, že vzor X_1(ß) patří do „4 pro každou Borelovskou množinu B G B na R (tj. X : Q —> R je tzv. borelovsky měřitelná). Množinová funkce PX{B) = P{X-\B)) se nazývá rozdělení pravděpodobnosti náhodné veličiny X. Náhodný vektor (Xi,..., X/c) na (Q, ^4, P) je /c-tice náhodných veličin. Definice náhodné veličiny zajišťuje, že pro všechny —oo < a < b < oo existuje pravděpodobnost P(a < X < b), kde používáme stručné značení projev A = (w G Q; a < X{uo) < b)). Definice Distribuční funkcí (distribution , cumulative density function) náhodné veličiny X je funkce F :R- ^Rdef novaná pro všechny x G R vztahem F(x) = P(X R definovaná pro všechny (xi,..., .. ,X/() je funkce Xk) G Rfc vztahem F(x ) = P(Xi < xi A • •AXt xn. Q Je-li X spojitá, pak je F (x) diferencovatelná a její derivace se rovná hustotě X, tj. platí F'(x) = f (x). Distribuční fun o o □ gp - = -E-O^O