PSY117/454 Statistická analýza dat v psychologii ­ přednáška 7 Počet pravděpodobnosti Pravděpodobnost jevu Pravděpodobnost, že nastane jev A jistý jev : P = 1 nemožný jev : P = 0 2 pojetí pravděpodobnosti subjektivní jistota četnostní (statistická): z m náhodných pokusů nastal jev A n-krát P(A) = n / m , blíží-li se počet pokusů (populaci) AJ: probability, event, random trial Jevy a náhodné pokusy Jevy hodnoty proměnných ­ např. Petr má IQ = 150 vzorek 15 IQ (lidí) ­ 15 jevů ...a jejich kombinace (složené jevy) náhodné vs. deterministické, 2: neslučitelné(disjunktní), ekvivalentní doplňkový jev ( ) Pole jevů množina hodnot, kterých může proměnná/é nabývat proměnná Náhodný pokus situace, kdy z pole jevů může nastat jeden nebo více jevů výběr a změření člověka, hod kostkou nelze určit, který jev nastane & lze opakovat bez vzájemného ovlivňování Náhodným pokusem získáváme z pole jevů jev. AJ: event, sample space, random trial, random vs. deterministic events, mutally exclusive events, equivalent events A Počítání s pravděpodobnostmi ,,NEBO" ­ součet jevů nastane jev A nebo jev B [nebo oba pokud nejsou disjunktní] P(AUB) = P(A) + P(B) ­ [P(AB)] př. náhodně vybraný člověk je žena nebo psycholog př. disj. náhodně vybraný člověk má základní vz. nebo je vyučen . ,,A" ­ součin jevů nastane jev A a zároveň nastane jev B P(AB) = P(A) . P(B) př. náhodně vybraný člověk je psycholožka AJ: and, or, addition, multiplication, probability calculus Podmíněná pravděpodobnost Jaká je pravděpodobnost jevu A, pokud nastal jev B? P(A|B) ... P(AB) = P(A|B) . P(B) př. kouří-li člověk (jev B), je riziko onemocnění rakovinou (jev A) 40% : P(A|B) Kuřáků je 30% - P(B) = 0,3. P, že náhodně vybraný člověk je kuřák, kt. onemocní rakovinou je 12% Bayesův teorém přepočet mezi P(A|B) a P(B|A) P(A|B) = P(A).P(B|A) / [P(A).P(B|A) + P(A).P(B|A)] př. v Hendlovi (s.120) př. Test na rakovinu má 10% chybovost (P(B|A)=0,9, P(B|A)=0,1 ) Prevalence rakoviny je 20%. (P(A)=0,2) P., že člověk s pozitivním výsledkem v testu má rakovinu? 0,2.0,9/(0,2.0,9+0,8.0,1) = 0,69 AJ: conditional probability, Bayes's theorem K dostudování Kombinatorika ­ velikost pole jevů permutace n prvků = n! kombinace r prvků z n-prvkové množiny = n! / r!(n-r)! Šance ­ odds ratio častý způsob vyjádření pravděpodobnosti šance Komety na vítězství jsou 1:10 = P(A) / P(A) AJ: permutations, combinations, odds ration Pravděpodobnostní rozložení náhodné proměnné Je-li proměnná náhodná (tj. její hodnoty lze považovat za výsledek náhodných pokusů)... ...jaká je pravděpodobnost výskytu jednotlivých možných hodnot? Vzpomeňme si, že P(A) = n / m , blíží-li se počet pokusů (populaci) Máme-li tedy dost velký, náhodně vybraný vzorek, pak P výskytu jednotlivých hodnot = jejich relativní četnost Pravděpodobnostní rozložení rozložení relativních četností U spojitých proměnných většinou neuvažujeme o pravděpodobnostech výskytu jednotlivých hodnot (je jich nekonečno), ale spíše o pravděpodobnosti výskytu hodnot v intervalech ­ hustota pravděpodobnosti U diskrétních proměnných uvažujeme o pravděpodobnostech výskytu jednotlivých hodnot. P-nostní rozložení je popsáno distribuční funkcí F(x) = P(Xx) tj. P. výskytu hodnot x Tato P je rovna ,,ploše oblasti pod křivkou" AJ: random variable, probability distribution, distribution function, probability density Normální rozložení 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 -4 -3 -2 -1 0 1 2 3 4 kumulativní relativní četnosti normálního rozložení - graf distribuční funkce hustota (četnosti) normálního rozložení Důležitá p-nostní rozložení Normální Poissonovo Studentovo t- rozložení Fisherovo F-rozložení 2-rozložení (chí-kvadrát) Binomické (Hendl, 134) Vyjma binomického se všechna uvedená rozložení používají jako přibližné (asymptotické) ideály, jimž by se rozložení našich proměnných (statistik) blížilo, kdybychom měli obrovský a reprezentativní vzorek. AJ: random variable, probability distribution, distribution function