12.2 Počet pravděpodobnosti a základy statistiky V této kapitole jsou použité příklady z knihy: Musilová & Musilová (2006).
Rozdělení pravděpodobnosti diskrétní náhodné veličiny $X$ vyjadřuje tzv. pravděpodobnostní funkce $P(X)$ s hodnotami pravděpodobnosti $p(x_i)=p_i$, kde $\sum_i p_i=1$. Rozdělení pravděpodobnosti spojité náhodné veličiny $X$ udává funkce hustoty rozdělení pravděpodobnosti (hustoty pravděpodobnosti) $f(x)$, pro kterou platí $ \int_\Omega f(x)\D x=1, $ kde $\Omega$ je definiční obor veličiny $X$. Pro hodnoty $x\notin\Omega$ platí $f(x)=0$. Významná rozdělení pravděpodobnosti jsou:
Rovnoměrné rozdělení pravděpodobnosti diskrétní i spojité náhodné veličiny $X$, které přiřazuje všem jejím hodnotám stejnou pravděpodobnost. Rovnoměrné rozdělení má ve všech bodech daného intervalu $\langle a,b\rangle,$ konstantní hustotu pravděpodobnosti
$$ f(x)=\left\{\begin{matrix}\frac{1}{b-a} & \mbox{pro } x\in\langle a,b\rangle \\ 0 & \mbox{pro } x\notin\langle a,b\rangle\end{matrix}\right. . $$12.10Poissonovo rozdělení pravděpodobnosti diskrétní náhodné veličiny $X$, které lze vyjádřit pomocí zvoleného parametru $\lambda>0$ jako
$$ p_i=\frac{\lambda^{x_i}}{x_i!}\ee^{-\lambda}. $$12.11Normální (Gaussovo) rozdělení pravděpodobnosti spojité náhodné veličiny $X$, které je definováno hustotou pravděpodobnosti ve tvaru tzv. Gaussovy funkce
$$ f(x)=\frac{1}{\sigma\sqrt{2\pi}}\ee^{-\expover{{(x-\mu)}^2}{2\sigma^2}}, $$12.12kde parametr $\mu$ znamená střední hodnotu veličiny $X$, parametr $\sigma$ jeho směrodatnou odchylku (viz dále). Ve statistické fyzice se také střední počet rozlišitelných částic (např. molekul) ve stavu s energií $E$ určuje pomocí tzv. Maxwellovy-Boltzmannovy rozdělovací funkce. Pro nerozlišitelné částice platí tzv. Fermiho-Diracovo rozdělení pro fermiony (elektrony, protony, neutrina, atd.) a Boseho-Einsteinovo rozdělení pro bosony (např. fotony). V matematické statistice se často používá tzv. Studentovo rozdělení (viz např. Pánek 2001), atd. V návaznosti na rozdělení pravděpodobnosti můžeme určit celou řadu statistických nástrojů, pomocí nichž můžeme analyzovat náhodnou veličinu $X$ (reprezentující například soubor naměřených hodnot). Mezi nejdůležitější z nich patří:
-
Váha - v případě diskrétní náhodné veličiny $X$ s jednotlivými hodnotami $x_i$ zavádíme tzv. váhu $w_i$, kterou můžeme zpravidla stanovit na základě tzv. vnitřních nejistot (chyb) $\delta x_i$ hodnot $x_i$ (například chyby měření, atd.), tedy na základě relace
$$ w_i\sim \frac{1}{\delta{x_i}^2}. $$12.13Dále zavedeme tzv. {sumu vah} $S_w$ a tzv. {střední váhu} $w_s$,
$$ S_w=\sum_{i=1}^Nw_i,\quad w_s=\dfrac{1}{N}\sum_{i=1}^Nw_i=\dfrac{S_w}{N}, $$12.14kde $N$ je celkový počet diskrétních hodnot $x_i$. Mezi váhami a hodnotami pravděpodobnosti existuje tedy volná relace - pokud suma vah $S_w=1$, potom $w_i=p_i$. Obdobným způsobem můžeme v případě spojité náhodné veličiny zavést tzv. váhovou funkci $w(x)$, jejíž
suma
bude dána jako $\int_\Omega w(x)\D x$. Je tedy opět zjevné, že pokud tento integrál bude normován (bude roven jedné) bude platit $w(x)=f(x)$, váhová funkce se takto stává hustotou pravděpodobnosti. Střední hodnota (aritmetický průměr), která se obvykle značí $\bar{x}$, $\langle{x}\rangle$ nebo také $\mu$. V případě {diskrétní} náhodné veličiny $X$ bude střední hodnota definována jako suma všech hodnot $x_i$ veličiny $X$ dělená jejich počtem nebo jako suma násobků všech hodnot veličiny $X$ s příslušnými hodnotami pravděpodobnostní funkce, tedy
$$ \langle{x}\rangle=\frac{1}{N}\sum_{i=1}^Nx_i=\sum_{i=1}^Nx_ip_i. $$12.15V případě použití druhého vztahu mluvíme také o tzv. očekávané hodnotě, značené $E(X)$, resp. o váženém aritmetickém průměru. Jemný rozdíl mezi těmito pojmy závisí na definici prvku $x_i$ veličiny $X$, případně na způsobu volby tzv. statistické váhy. Tzv. váhovanou střední hodnotu ({váhovaný} aritmetický průměr) stanovíme jako
$$ \langle{x}\rangle=\frac{1}{S_w}\sum_{i=1}^Nx_iw_i. $$12.16Střední hodnotu (neváhovanou a váhovanou) spojité náhodné veličiny $X$ stanovíme jako
$$ \langle{x}\rangle=E(X)=\int_\Omega x\,f(x)\D x,\quad \langle{x}\rangle=\frac{\int_\Omega x\,w(x)\D x}{\int_\Omega w(x)\D x}. $$12.17V případě dále uváděných statistických nástrojů je stanovení jejich váhovaných podob zcela obdobné.
-
Rozptyl a směrodatná odchylka jsou nejčastěji označované jako $D(X)$, $\text{var}(X)$, případně $\sigma^2(X)$ (rozptyl) a $\sigma(X)$ (směrodatná odchylka). Rozptyl (disperze) je definován jako střední hodnota druhých mocnin odchylek od střední hodnoty (aritmetického průměru) veličiny $X$, směrodatná odchylka je odmocninou z rozptylu. Pro diskrétní náhodnou veličinu $X$ se stejnou váhou (pravděpodobností) všech hodnot $x_i$ je rozptyl definován jako
$$ D(X)=\frac{1}{N}\sum_{i=1}^N(x_i-\langle{x}\rangle)^2=\langle{x^2}\rangle-\left\langle{x}\right\rangle^2. $$12.18V případě různých pravděpodobností diskrétních hodnot náhodné veličiny $X$ bude rozptyl určen vztahem
$$ D(X)=\sum_{i=1}^N p_i\cdot(x_i-\langle{x}\rangle)^2=-\langle{x}\rangle^2+\sum_{i=1}^N x_i^2\cdot p_i. $$12.19Pro spojitou náhodnou veličinu $X$ je rozptyl definován vztahem
$$ D(X)=\int_\Omega(x-\langle{x}\rangle)^2\,f(x)\D x\,=-\langle{x}\rangle^2+\int_\Omega x^2f(x)\D x. $$12.20Pro směrodatnou odchylku obecně platí $\sigma(X)=\sqrt{D(X)}$.
-
Nejpravděpodobnější hodnotu $P_{\max}(X)$ pro diskrétní náhodnou veličinu $X$ stanovíme jako hodnotu $x_i$ s nejvyšší hodnotou pravděpodobnostní funkce $p_i$, tedy $P_{\max}(X)=(x_i,{\max}\,(p_i))$. V případě spojité náhodné veličiny $X$ určíme nejpravděpodobnější hodnotu $P_{\max}(X)$ jako maximum funkce hustoty pravděpodobnosti $f(x)$ v definičním oboru $\Omega$ veličiny $X$, tedy $P_{\max}(X)={\max}\,(f(x))$ pro $x\in\Omega$.
Medián ($\tilde{x}_{0,5}$) a čtvrtkvantily ($\tilde{x}_{0,25},\,\tilde{x}_{0,75}$, také nazývané dolní a horní kvartil) jsou hodnoty $x_i$, v nichž je monotónně uspořádaný statistický soubor rozdělen na příslušné množství stejně početných částí. Medián tedy dělí statistický soubor na dvě stejně početné poloviny. Výhodou mediánu oproti střední hodnotě je jeho neovlivnitelnost extrémně vychýlenými hodnotami. Například u souboru $\{1,\,2,\,2,\,3,\,27\}$ medián $\tilde{x}_{0,5}=2$, střední hodnota $\langle{x}\rangle=7$. V případě spojité náhodné veličiny $X$ určíme medián a čtvrtkvantily (případně jakkoli jinak definované kvantily) z integrálních rovnic
$$ \int_{-\infty}^{\tilde{x}_{0,5}}f(x)\D x\,=\frac{1}{2},\quad \int_{-\infty}^{\tilde{x}_{0,25}}f(x)\D x\,=\frac{1}{4},\quad \int_{-\infty}^{\tilde{x}_{0,75}}f(x)\D x\,=\frac{3}{4}. $$12.21Distribuční funkce $F(x)$ vyjadřuje pravděpodobnost, že hodnota náhodné veličiny $X$ s daným rozdělením pravděpodobnosti bude menší nebo rovna $x$. V případě diskrétní náhodné veličiny $X$ bude distribuční funkce $F(x)$ daná předpisem
$$ F(x)=P(X\leq x)=\sum_{x_i\leq x}p_i\,, $$12.22bude tedy v bodech $x_i$ nespojitá a mezi body $x_i$ konstantní. Pro spojitou náhodnou veličinu $X$ můžeme distribuční funkci $F(x)$ zapsat jako integrál funkce hustoty pravděpodobnosti,
$$ F(x)=\int_{-\infty}^x f(t)\D t. $$12.23Každá distribuční funkce $F(x)$ je neklesající a zprava spojitá, její asymptotické vlastnosti lze vyjádřit jako $\lim\limits_{x\to+\infty}F(x)=1, \lim\limits_{x\to-\infty}F(x)=0$, pro libovolnou dvojici $x_1,x_2$ platí $P(x_1<x\le x_2)=F(x_2)-F(x_1)$.
-
Maxwellovo-Boltzmannovo rozdělení rychlostí: Předpokládejme normální rozdělení rychlostí $v_x\equiv v$ jednotlivých částic (molekul), ve smyslu rovnice 12.12, ve tvaru
\begin{align} f(v)=a\ee^{-bv^2}, \end{align}12.24s prozatím neznámými konstantami $a$ a $b$, kde ze symetrie Gaussovy funkce pro kladné a záporné rychlosti můžeme předpokládat střední hodnotu rychlostí $\mu$ podle rovnice 12.12 jako nulovou. V trojrozměrném případě musí tedy platit
\begin{align} \int_\Omega f(v)\D^3 v=\int_{-\infty}^\infty\int_{-\infty}^\infty\int_{-\infty}^\infty A\ee^{-Bv^2}\D v_x\D v_y\D v_z=1, \end{align}12.25kde $v^2=v_x^2+v_y^2+v_z^2$. Protože rozdělení rychlostí (pokud je látka jako celek v klidu) je v každém místě vektorového prostoru rychlostí izotropní (stejné v každém směru), můžeme s výhodou přejít do sférického systému (sférického rychlostního prostoru), kde
\begin{align} \D v_x\D v_y\D v_z=v^2\sin\theta\D v\D\theta\D\phi \end{align}12.26\begin{align} P(v)=\int_\Omega f(v)\D v=4\pi A\int_0^\infty v^2\ee^{-Bv^2}\D v=1, \end{align}12.27kde $v$ je radiální složka vektoru rychlosti ve sférickém rychlostním prostoru, tedy vlastně velikost rychlosti. Integraci rovnice 12.27 provedeme nejlépe pomocí substituce $Bv^2=x$,
\begin{align} 1=\frac{4\pi A}{2B^{3/2}}\int_0^\infty\ee^{-x}\sqrt{x}\D x. \end{align}12.28Samotný integrál v rovnici 12.28 je tzv. Gama funkce (zobecněný faktoriál, viz například Arfken & Weber (2005)), definovaná jako
\begin{align} \Gamma(x)=\int_0^\infty \ee^{-t}t^{x-1}\D t, \end{align}12.29půjde zde tedy o funkcionál $\Gamma(\frac{3}{2})$ (funkcionál je v matematické analýze definován jako zobrazení, které prvkům prostoru funkcí přiřazuje reálné nebo komplexní číslo). Pro funkci $\Gamma$ zjevně platí $\Gamma(x+1)=x\,\Gamma(x)$, lze tedy stanovit $\Gamma(\frac{3}{2})=\frac{1}{2}\Gamma(\frac{1}{2})=\sqrt{\pi}/2$, přičemž nalezení hodnoty funkcionálu $\Gamma(\frac{1}{2})=\sqrt{\pi}$ lze provést obdobným způsobem jako nalezení hodnot integrálů v příkladu 1.95.
Z rovnice 12.28 tak dostáváme
\begin{align} A=\left(\frac{B}{\pi}\right)^{3/2}. \end{align}12.30Protože střední kinetická energie částice, pohybující se rychlostí $v$, je $\langle E_k\rangle =\frac{1}{2}m\langle v^2\rangle=\frac{3}{2}kT$ (viz např. Halliday, Resnick, & Walker (2001), kapitola 20.5), můžeme napsat rovnici
\begin{align} \frac{3}{2}kT=\frac{1}{2}m\int_\Omega v^2 f(v)\D v=2\pi m\left(\frac{B}{\pi}\right)^{3/2}\int_0^\infty v^4\ee^{-Bv^2}\D v, \end{align}12.31\begin{align} B=\frac{m}{2kT}. \end{align}12.32Explicitní tvar Maxwellova-Boltzmannova rozdělení rychlostí ve smyslu rovnice 12.27 tedy bude
\begin{align} f(v)=4\pi\left(\frac{m}{2\pi kT}\right)^{3/2}v^2\ee^{-\textstyle\frac{mv^2}{2kT}}. \end{align}12.33
Příklady
Střelec provedl $N=150$ výstřelů na terč, který je tvořen soustavou $n=5$ mezikruží $MK_i$, $i=1,.\,.\,.\,,5$. Mezikruží $MK_i$ přitom zasáhl $N_i$-krát, kde $N_1=15,\,N_2=20,\,N_3=35,\,N_4=45,\,N_5=35$. Za zásah mezikruží $MK_i$ získal $i$ bodů. Náhodnou veličinu $X$ s diskrétním rozdělením definujeme jako počet bodů, získaných pro jeden náhodný výstřel. Určete:
-
rozdělení $\left\{\left(x_i,p_i\right)\right\}$ veličiny $X$,$\left\{\left(1,\dfrac{1}{10}\right),\left(2,\dfrac{2}{15}\right),\left(3,\dfrac{7}{30}\right), \left(4,\dfrac{3}{10}\right),\left(5,\dfrac{7}{30}\right)\right\}$
-
pravděpodobnost, že pro náhodný výstřel získá střelec alespoň $I$ bodů, $I=1,2,3,4,5$,$P_1=1,\,P_2=\dfrac{9}{10},\,P_3=\dfrac{23}{30},\,P_4=\dfrac{8}{15},\,P_5=\dfrac{7}{30}$
-
střední hodnotu veličiny $X$,$3,\!4\bar{3}$
-
směrodatnou odchylku veličiny $X$,$1,\!26$
-
pravděpodobnost, že při výstřelu získá střelec počet bodů v intervalu $i\in\langle 2,4\rangle$.$\dfrac{2}{3}$
Na letištních záchodech jsou čtyři kabinky. Je dána distribuční funkce obsazení kabinek: $F(0)=0,\!1,\,F(1)=0,\!35,\,F(2)=0,\!6,\,F(3)=0,\!95,\,F(4)=1$.
-
rozdělení náhodné veličiny $X$, odpovídající počtu obsazených kabinek,$\left\{\left(0;\,0,\!1\right),\left(1;\,0,\!25\right),\left(2;\,0,\!25\right), \left(3;\,0,\!35\right),\left(4;\,0,\!05\right)\right\}$
-
střední hodnotu veličiny $X$ a její rozptyl,$2;\,1,\!2$
-
pravděpodobnost, že budou obsazeny alespoň dvě kabinky.$0,\!65$
Je dána funkce $f(x)=k\cdot x$ pro $0\leq x\leq 2$ a $f(x)=0$ v ostatních případech. Určete:
-
konstantu $k$ tak, aby funkce byla hustotou pravděpodobnosti,$k=\dfrac{1}{2}$
-
střední hodnotu a rozptyl,$\dfrac{4}{3},\,\dfrac{2}{9}$
-
nejpravděpodobnější hodnotu,$2$
-
medián a čtvrtkvantily $\tilde{x}_{0,25},\tilde{x}_{0,75}$,$\tilde{x}_{0,5}=\sqrt{2},\,\tilde{x}_{0,25}=1,\,\tilde{x}_{0,75}=\sqrt{3}$
-
distribuční funkci.$F(x)=0$ $\forall$ $x<0$, $F(x)=\dfrac{1}{4}x^2$ $\forall$ $0\le x\le 2$, $F(x)=1$ $\forall$ $x>2$
Je dána funkce $f(x)=\dfrac{k}{(x+1)^2}$ pro $x\geq 0$ a $f(x)=0$ pro $x<0$. Určete:
-
konstantu $k$ tak, aby funkce byla hustotou pravděpodobnosti,$k=1$
-
distribuční funkci,$F(x)=0$ $\forall$ $x\leq 0$, $F(x)=\dfrac{x}{x+1}$ $\forall$ $x>0$
-
nejpravděpodobnější hodnotu, medián a čtvrtkvantily $\tilde{x}_{0,25},\tilde{x}_{0,75}$.$0,\,\,\tilde{x}_{0,5}=1,\,\tilde{x}_{0,25}=\dfrac{1}{3},\,\tilde{x}_{0,75}=3$
Jsou dány funkce $f(x)=\dfrac{k}{x^2}$ pro $1\leq x\leq 2$, $f(x)=0$ v ostatních případech, $g(x)=c\big(x-x^2\big)$ pro $0\leq x\leq 1$, $g(x)=0$ v ostatních případech. Určete:
-
konstanty $k$ a $c$ tak, aby funkce byly hustotami pravděpodobnosti,$k=2,\,c=6$
-
příslušné distribuční funkce,$F_1(x)=0$ $\forall$ $x<1$, $F_1(x)=2\dfrac{x-1}{x}$ $\forall$ $1\leq x\leq 2$, $F_1(x)=1$ $\forall$ $x>2$,
$F_2(x)=0$ $\forall$ $x<0$, $F_2(x)=3x^2-2x^3$ $\forall$ $0\leq x\leq 1$, $F_2(x)=1$ $\forall$ $x>1$ -
nejpravděpodobnější hodnotu, střední hodnotu, rozptyl a medián pro každé z rozdělení.$f:\,1,\,2\ln 2,\,2-4\ln^2\,2,\,\dfrac{4}{3},\,\,g:\,\dfrac{1}{2},\,\dfrac{1}{2},\,\dfrac{1}{20},\,\dfrac{1}{2}$
Házíme dvěma kostkami. Náhodnou veličinou $X$ označme součet bodů na obou kostkách při jednom hodu. Určete:
-
rozdělení veličiny $X$,$\left\{\!\left(1,0\right)\!,\left(2,\dfrac{1}{36}\right)\!,\left(3,\dfrac{1}{18}\right)\!, \left(4,\dfrac{1}{12}\right)\!,\left(5,\dfrac{1}{9}\right)\!,\left(6,\dfrac{5}{36}\right)\!,\left(7,\dfrac{1}{6}\right)\!, \left(8,\dfrac{5}{36}\right)\!,\left(9,\dfrac{1}{9}\right)\!,\right.$
$\left(10,\dfrac{1}{12}\right)\!, \left.\left(11,\dfrac{1}{18}\right)\!,\left(12,\dfrac{1}{36}\right)\!\right\}$ -
distribuční funkci,$F(x)=0$ $\forall$ $x<2$, $F(x)=\dfrac{1}{36}$ $\forall$ $x\in\langle 2,3)$, $F(x)=\dfrac{1}{12}$ $\forall$ $x\in\langle 3,4)$, $F(x)=\dfrac{1}{6}$ $\forall$ $x\in\langle 4,5)$, $F(x)=\dfrac{5}{18}$ $\forall$ $x\in\langle 5,6)$, $F(x)=\dfrac{5}{12}$ $\forall$ $x\in\langle 6,7)$, $F(x)=\dfrac{7}{12}$ $\forall$ $x\in\langle 7,8)$, $F(x)=\dfrac{13}{18}$ $\forall$ $x\in\langle 8,9)$, $F(x)=\dfrac{5}{6}$ $\forall$ $x\in\langle 9,10)$, $F(x)=\dfrac{11}{12}$ $\forall$ $x\in\langle 10,11)$,\,\,$F(x)=\dfrac{35}{36}$ $\forall$ $x\in\langle 11,12)$, $F(x)=1$ $\forall$ $x\geq 12$
-
střední hodnotu, rozptyl a nejpravděpodobnější hodnotu,$7;\,5,\!83;\,7$
-
pravděpodobnost, že součet bodů na kostkách bude ležet v intervalu $\langle 5,7\rangle$.$\dfrac{5}{12}$