Základy zpracování geologických dat Rozdělení pravděpodobnosti §R. Čopjaková § § rozdeleni cetnosti Od četnosti k pravděpodobnosti zahušťujeme měření zahušťujeme měření n f n f Hustota rozdělení pravděpodobností frekvenční funkce pravděpodobnostní funkce Vztah mezi frekvenční a distribuční funkcí §pro distribuční fci diskrétní náhodné veličiny platí: F(x) = P(X ≤ x) a tedy histogramy f(x) F(x) \begin{displaymath} F(x) = \sum_{x_i \leq x} p(x_i) \end{displaymath} ~AUT0005 Lognormální rozdělení (logaritmicko-normální rozdělení) § § Frekvenční funkce lognormálního rozdělení LN (m, s2): µ,σ2 jsou parametry lognormálního rozdělení Má-li náhodná veličina X rozdělení LN (m, s2), má potom náhodná veličina Y = ln X rozdělení N (m, s2). Má-li veličina Y rozdělení N (m, s2), potom veličina X = eY má rozdělení LN (m, s2). => Soubor dat s lognormálním rozdělením pravděpodobností lze snadno transformovat na soubor dat s normálním rozdělením pravděpodobností např. yi = ln xi => xi = eYi yi = log xi => xi = 10Yi Lognormální rozdělení mají např. § Vhodné pro jednostranně ohraničená data – např. fyzikální veličiny (teplota, tlak, hmotnost, objem, …) § § zrnitost některých sedimentů § mocnost sedimentárních hornin § propustnost sedimentárních hornin § koncentrace stopových prvků v horninách § pórovitost magmatických hornin § průtok vody v řekách § § Lognormální rozdělení (logaritmicko-normální rozdělení) §Střední hodnota - při použití transformace ln(x) spočtu jako x = ey ; tedy §tzv. geometrický průměr - další možný dopočet dle: § § §lze chápat jako zobecněný průměr s transformací f(x) = ln x §Míra variability - směrodatnou odchylku NEUŽÍVAT - (výpočet analogicky jako pro střední hodnotu) lognorm rozd Binomické rozdělení §Binomické rozdělení Bi (n,p) popisuje četnost výskytu náhodného jevu v n nezávislých pokusech, v nichž má jev stále stejnou známou pravěpodobnost p. § §Diskrétní náhodná veličina X s binomickým rozdělením může nabývat celočíselných hodnot od nuly po n. Pravděpodobnost, že jev nastane právě x-krát z n pokusů při pravděpodbnostijevu p, je určena rozdělením § § § § počet pokusů n § pravděpodobnost úspěchu p § pravděpodobnost neúspěchu 1-p = q § počet úspěšných pokusů x § § §Pro a malé pravděpodobnosti přechází binomické rozdělení v rozdělení Poissonovo. §Pro p blízké 0,5 lze binomické rozdělení již od n v řádu několika desítek velmi dobře aproximovat normálním rozdělením. § § P[X=x] = {n \choose x}p^x(1-p)^{n-x} n\to\infty p\to 0 §střední hodnota: E(x) = np § §rozptyl: σ2(X) = np(1 − p) =npq §a směrodatná odchylka je odmocninou z rozptylu: § § Jaká je pravděpodobnost, že při 5 vrzích kostkou padne právě 2× číslo 1? § pak n = 5; pravděpodobnost úspěchu p = 1/6; § pravděpodobnost neúspěchu 1-p = q = 5/6 § § § § Kombinační číslo - počet kombinací x-té třídy z n prvků bez opakování § –počet K(x, n) všech x-členných kombinací z n prvků je: n! – x!(n − x)! p_2= {5 \choose 2}\left(\frac{1}{6}\right)^2\left(1-\frac{1}{6}\right)^{(5-2)} \approx 0,16 = 16% P[X=x] = {n \choose x}p^x(1-p)^{n-x} Binomické rozdělení § Ropná společnost provede 3 vrty, pravděpodobnost, že narazí na ropu je 0,3. Spočti hustotu pravděpodobnosti pro binomické rozdělení a stanov pravděpodobnost, že společnost minimálně dvěma vrty narazí na ropu. § § § § § § § § § § x P(x) 0 (0,3)0 (0,7)3 = 0,343 1 (0,3)1 (0,7)2 = 0,441 2 (0,3)2 (0,7)1 = 0,189 3 (0,3)3 (0,7)0 = 0,027 image_pnost211 image_pnost212 image_pnost213 image_pnost214 žádný úspěšný vrt jeden úspěšný vrt dva úspěšné vrty tři úspěšné vrty střední hodnota E(X) = n.p = 3 . 0,3 = 0,900 rozptyl npq = 3.0,3.0,7 = 0,63 minimálně dva úspěšné vrty z f(x): 0,189+0,027 = 0,216 z F(x): 1- F(1) = 1-0,784 = 0,216 frekvenční kunkce binomického rozdělení distribuční funkce binomického rozdělení \begin{displaymath} F(x) = \sum_{x_i \leq x} p(x_i) \end{displaymath} Rovnoměrné rozdělení Rovnoměrné (diskrétní) rozdělení - jev může nabývat jednoho z k-stavů, všechny stavy mají stejnou pravděpodobnost např. zájem o jednotlivé studijní obory je rovnoměrný Alternativní (Bernouliho, nula-jedničkové) rozdělení jev může nabývat jednoho ze dvou stavů (0 nebo 1) §Studentovo rozdělení modeluje rozdělení průměrů všech možných souborů o velikosti n §je podobné standardizovanému normálnímu rozdělení §je symetrické kolem střední hodnoty μ = 0 §má pouze 1 parametr: §stupně volnosti: n = n-1; Co to jsou stupně volnosti? n = počet pozorování mínus počet parametrů §Využívá se při testování statistických hypotéz – tzv. t-testy, např. testování rozdílu mezi dvěma průměry. § Speciální spojitá rozdělení §Studentovo rozdělení (t-rozdělení) - rozdělení odchylky průměru od střední hodnoty §Aritmetický průměr výběrového souboru s normálním rozdělením se může více či méně lišit od střední hodnoty základního souboru. Provádíme opakovaně výběry o stejném rozsahu pro které spočteme aritmetický průměr X a směrodatnou odchylku S. Pak veličina má Studentovo rozdělení s n-1 stupni volnosti. § § Hustota rozdělení pravděpodobností t-rozdělení pro různé stupně volnosti § § \begin{displaymath}t = \frac{(\overline{X} - \mu) \sqrt{n}}{S} \end{displaymath} Speciální spojitá rozdělení §Rozdělení chí-kvadrát §Využívá se při testování statistických hypotéz §Nejčastěji při testování shody empirického rozdělení (rozdělení četností naměřeného souboru dat) s předpokládaným teoretickým rozdělením tzv. Pearsonův test neboli chí-kvadrát test Speciální spojitá rozdělení Fisher-Snedeckorovo rozdělení F-rozdělení využití při testování statistických hypotéz, při analýze rozptylu např. test shody rozptylů dvou výběrů z normálního rozdělení. Statistické funkce v excelu §NORMDIST stanovení hodnoty pravěpodobnosti frekvenční nebo distribuční funkce normálního rozdělení N (m,s2) §NORMINV určí kvantil normálního rozdělení N (m,s2) § § pro standardizované normální rozdělení N (0, 1) §NORMSDIST §NORMSINV § §LOGNORMDIST stanovení hodnoty pravěpodobnosti frekvenční nebo distribuční funkce logaritmicko-normálního rozdělení §BINOMDIST stanovení hodnoty pravěpodobnosti frekvenční nebo distribuční funkce binomického rozdělení Bi (n,p) §TINV určí kvantil studentova rozdělení §FINV určí kvantil Fisher-Snedeckorova rozdělení §CHIINV určí kvantil chí-kvadrát rozdělení § §