Přechod na menu, Přechod na obsah, Přechod na patičku
     

Základní a výběrový soubor


Základní soubor – je neprázdná množina, jejíž prvky jsou objekty

Výběrový soubor – libovolná konečná podmnožina základního prostoru o rozsahu \(n\)

  • Absolutní četnost – počet objektů ve výběrovém souboru pocházející z konkrétní podmnožiny nebo splňující určitou vlastnost
  • Relativní četnost – absolutní četnost podělená rozsahem výběrového souboru, tedy četnost vzhledem k celému výběrovému souboru
Příklad 1:

V nadnárodní firmě je velký počet zaměstnanců (základní soubor). Bylo zjišťováno, jaké je nejvyšší dosažené vzdělání zaměstnanců. Podmnožina S obsahuje zaměstnance, kteří mají středoškolské vzdělání a podmnožina V obsahuje zaměstnance s vysokoškolským vzděláním. Náhodně bylo vylosováno 20 zaměstnanců (ti tvoří výběrový soubor o rozsahu 20). Z nich 12 má středoškolské vzdělání a 8 vysokoškolské vzdělání.

\(n\) … rozsah výběrového souboru, tzn. počet zaměstnanců, kteří byli vylosováni
\(n(S)\) … absolutní četnost středoškoláků, tzn. počet středoškoláků, kteří byli vylosováni
\(p(S)\) … relativní četnost středoškoláků
\(n =\)
\(n(S) =\)
\(p(S) =\)
\(n = 20\)
\(n(S) = 12\)
\(p(S) = 12/20 = 0,6\)

Závěr: Z 20 vylosovaných zaměstnanců má 60% pouze středoškolské vzdělání.

Datový soubor – do něj zaznamenáváme hodnoty znaku \(X\) zjišťované na množině objektů, tvořících výběrový soubor. Dostáváme tak vektor \((x_{1}, \ldots, x_{n})^T\). Můžeme zaznamenávat i hodnoty více znaků, pak se jedná o vícerozměrný datový soubor. Uspořádané hodnoty tvoří uspořádaný datový soubor, značíme: \((x_{(1)}, \ldots, x_{(n)})^T\)

Vektor variant – navzájem různé a uspořádané hodnoty znaku \(X\), značíme: \((x_{[1])}, \ldots, x_{[r]})^T\)

  • Absolutní četnost varianty \(x_{[j]}\): \[n_j = card\{j;x = x_{[j]}\}\]
  • Relativní četnost varianty \(x_{[j]}\): \[p_j=\frac{n_j}{n}\]
  • Absolutní kumulativní četnost prvních \(j\) variant: \[N_j = n_1+n_2+\ldots +n_j\]
  • Relativní kumulativní četnost prvních \(j\) variant: \[F_j = \frac{N_j}{n}=p_1+\ldots +p_j\]

Tabulky četností a grafy


Bodové rozložení četností

– četnosti přiřazujeme jednotlivým variantám, počet variant je malý

Příklad 1.1:

U 15 kuřáků bylo zjišťováno, kolik krabiček cigaret vykouří za den.

Počet krabiček cigaret 1 2 3 4
Počet kuřáků 7 4 3 1
postup
postup v programu Statistica
Vytvoříme tabulku rozložení četností:

Grafy

  • Četnostní funkce: \[p(x)=\begin{cases} p_j, & pro\ x=x_{[j]}, j=1,\ldots,r \\ 0, & jinak \end{cases} \]
  • Empirická distribuční funkce: \[F(x)=\begin{cases} 0, & pro\ x\lt x_{[1]}\\ F_j, & pro\ x_{[j]}\leq x\lt x_{[j+1]}, j=1,\ldots,r-1 \\ 1, & pro\ x\geq x_{[r]} \end{cases} \]
Typy grafů:
  1. Graf četnostní funkce
  2. Graf empirické distribuční funkce
  3. Sloupkový diagram
  4. Polygon četností
  5. Výsečový graf
a. Graf četnostní funkce
postup
postup v programu Statistica
Na osu \(x\) naneseme hodnoty znaku \(X\), tedy \(x_{[j]}\) a na osu \(y\) naneseme hodnoty četnostní funkce. graf
b. Graf empirické distribuční funkce
postup
postup v programu Statistica
Na osu \(x\) naneseme hodnoty znaku \(X\) a na osu \(y\) naneseme hodnoty empirické distribuční funkce.
c. Sloupkový diagram
postup
postup v programu Statistica
Na osu \(x\) naneseme hodnoty znaku \(X\) a na osu \(y\) naneseme počet pozorování \((n_j)\). graf
d. Polygon četností
postup
postup v programu Statistica
Na osu \(x\) naneseme hodnoty znaku \(X\) a na osu \(y\) naneseme počet pozorování \((n_j)\). graf
e. Výsečový graf
postup
postup v programu Statistica
Výsečový graf zobrazuje relativní četnosti jednotlivých variant. graf

Intervalové rozložení četností

– četnosti přiřazujeme třídicím intervalům, počet variant je velký

\((u_j; u_{j+1}\rangle\ldots j\)-tý třídicí interval
\(d_j=u_{j+1}-u_j\ldots\) délka \(j\)-tého třídicího intervalu
\(x_{[j]}\ldots\) střed \(j\)-tého třídicího intervalu
\(r\ldots\) počet třídicích intervalů, nejčastěji se volí \(r\) blízké \(\sqrt{n}\) a nebo jej často volíme podle tzv. Sturgersova pravidla: \(r \approx 1+3,3\cdot \log(n)\), kde \(n\) je rozsah výběrového souboru.
  • Četnostní hustota \(j\)-tého třídicího intervalu: \[f_j=\frac{p_j}{d_j}\]
Příklad 1.2:

U 50 kuřáků bylo zjišťováno, kolik Kč za den zaplatí za cigarety.

Výdaje \((50;100\rangle\) \((100;150\rangle\) \((150;200\rangle\) \((200;250\rangle\) \((250;300\rangle\)
Počet kuřáků 18 7 13 7 5
postup
postup v programu Statistica

Grafy

  • Hustota četnosti: \[\tilde{f}(x)=\left\{ \begin{array}{l r} f_j & \text{pro}\ u_j \lt x \leq u_{j+1}, j=1,\ldots ,r \\ 0 & \text{jinak} \end{array} \right. \]
  • Intervalová empirická distribuční funkce: \[\tilde{F}(x)=\int_{-\infty}^x \tilde{f}(t)dt\]
Typy grafů:
  1. Histogram
  2. Graf intervalové empirické distribuční funkce
a. Histogram
postup
postup v programu Statistica

Pomocí histogramu znázorňujeme intervalové relativní četnosti. Schodovitá čára, která shora omezuje histogram, je grafem hustoty četnosti. Na osu \(x\) nanášíme hodnoty znaku \(X\), na osu \(y\) naneseme hodnoty četnostní hustoty, výšky obdélníků jsou četnostní hustoty a obsahy obdélníků odpovídají relativním četnostem.

graf
b. Graf intervalové empirické distribuční funkce
postup
postup v programu Statistica

N a osu \(x\) naneseme hodnoty znaku \(X\) a na osu \(y\) naneseme hodnoty intervalové empirické distribuční funkce

graf
RNDr. Marie Budíková, Dr. a kol. |
ÚMS, Přírodovědecká fakulta, Masarykova univerzita |
Návrat na úvodní stránku webu, přístupnost |
Stránky Přírodovědecké fakulty MU
| Technická spolupráce:
| Servisní středisko pro e-learning na MU
| Fakulta informatiky Masarykovy univerzity, 2016

Centrum interaktivních a multimediálních studijních opor pro inovaci výuky a efektivní učení | CZ.1.07/2.2.00/28.0041