PSY117/454 Statistická analýza dat v psychologii Přednáška 7Přednáška 7Přednáška 7Přednáška 7 Počet pravděpodobnostiPočet pravděpodobnostiPočet pravděpodobnostiPočet pravděpodobnosti Je známo, že když muž použije jeden z okrajových pisoárů, sníží se pravděpodobnost, že bude pomočen o 50%. anonym Pravděpodobnost jevu Pravděpodobnost, že nastane jev A jistý jev: P = 1 nemožný jev: P = 0 jisté a nemožné jevy se vyskytují pouze v teorii 2 pojetí pravděpodobnosti subjektivní jistota četnostní (statistická): z m náhodných pokusů nastal jev A n-krát P(A) = n /m , blíží-li se počet pokusů (populaci) AJ: probability, event, random trial Jevy a náhodné pokusy Jevy hodnoty proměnných ­ např. Petr má IQ = 150 vzorek 15 IQ (lidí) ­ 15 jevů ...a jejich kombinace (složené jevy) náhodné vs. deterministické, 2: neslučitelné(disjunktní), ekvivalentní doplňkový jev ( ) Pole jevů množina hodnot, kterých může proměnná/é nabývat proměnná Náhodný pokus situace, kdy z pole jevů může nastat jeden nebo více jevů výběr a změření člověka, hod kostkou nelze určit, který jev nastane & lze opakovat bez vzájemného ovlivňování Náhodným pokusem získáváme z pole jevů jev. AJ: event, sample space, random trial, random vs. deterministic events, mutally exclusive events, equivalent events A Počítání s pravděpodobnostmi ,,NEBO" ­ součet jevů - nastane jev A nebo jev B [nebooba nejsou-li disjunktní] P(AUB) = P(A) + P(B) ­ [P(AB)] př. náhodně vybraný člověk je žena nebo psycholog př. disj. náhodně vybraný člověk má základní vz. nebo je vyučen . ,,A" ­ součin jevů - nastane jev A a zároveň nastane jev B P(AB) = P(A) . P(B) př. náhodně vybraný člověk je psycholožka (pohlaví=žena, povolání=psychologie) Kombinatorika ­ velikost pole jevů permutace n prvků = n! kombinace r prvků z n-prvkové množiny = n! / r!(n-r)! Šance ­ odds ratio - častý způsob vyjádření pravděpodobnosti šance Komety na vítězství jsou 1:10 = P(A) / P(A) Podmíněná pravděpodobnost Jaká je pravděpodobnost jevu A, pokud nastal jev B? P(A|B) ... P(AB) = P(A|B) . P(B) př. kouří-li člověk (jev B), je riziko onemocnění rakovinou (jev A) 40% ... P(A|B) Kuřáků je 30, tedy P(B) = 0,3. P, že náhodně vybraný člověk je kuřák, kt. onemocní rakovinou je 12% Bayesův teorém přepočet mezi P(A|B) a P(B|A) P(A|B) = P(A).P(B|A) / [P(A).P(B|A) + P(A).P(B|A)] př. v Hendlovi (s.120) př. Test na LMD má 15% chybovost (P(T+|L+)=0,85; P(T+|L-)=0,15 ) Prevalence LMD je 10%. (P(L+)=0,1) P., že dítě s pozitivním výsledkem v testu má LMD? P(L+|T+)=? 0,1 . 0,85 / (0,1 . 0,85 + 0,9 . 0,15) = 0,390,390,390,39 AJ: conditional probability, Bayes's theorem Pravděpodobnostní rozložení náhodné proměnné Je-li proměnná náhodnáproměnná náhodnáproměnná náhodnáproměnná náhodná (tj. její hodnoty lze považovat za výsledek náhodných pokusů)... ...jaká je P výskytu jednotlivých možných hodnot? Vzpomeňme si, že P (A) = n / m , blíží-li se počet pokusů (populaci) Máme-li tedy dost velký, náhodně vybraný vzorek, pak P výskytu jednotlivých hodnot jejich relativní četnost Pravděpodobnostní rozloženíPravděpodobnostní rozloženíPravděpodobnostní rozloženíPravděpodobnostní rozložení = teoretické rozložení relativních četností U spojitých proměnných neuvažujeme o P výskytu jednotlivých hodnot (), ale spíše o p výskytu hodnot v intervalech ­ hustota pravděpodobnostihustota pravděpodobnostihustota pravděpodobnostihustota pravděpodobnosti U diskrétních proměnných uvažujeme o P výskytu jednotlivých hodnot. P-nostní rozložení je popsáno distribuční funkcídistribuční funkcídistribuční funkcídistribuční funkcí F(x) = P (Xx) tj. P výskytu hodnot x Tato P je rovna ,,ploše oblasti pod křivkou" AJ: random variable, probability distribution, distribution function, probability density Normální rozložení 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 -4 -3 -2 -1 0 1 2 3 4 kumulativní relativní četnosti normálního rozložení - graf distribuční funkce hustota (četnosti) normálního rozložení P v normálním rozložení Důležitá p-nostní rozložení Normální Poissonovo Studentovo t- rozložení Fisherovo F-rozložení 2-rozložení (chí-kvadrát) Binomické (Hendl, 134) Vyjma binomického se všechna uvedená rozložení používají jako přibližné (asymptotické) ideály, jimž by se rozložení našich proměnných (statistik) blížilo, kdybychom měli obrovský a reprezentativní vzorek. AJ: random variable, probability distribution, distribution function