2 Bodové a intervalové rozložení četností - OSNOVA Úvod • pilotní analýza • Motivace: Někdo nám poskytne data —y seznámení s daty, grafické znázornění • různý typ dat —y různé způsoby reprezentace a vizualizace — kategoriální data - pohlaví, vzdělání, počet sourozenců, ... — spojitá data - výška, porodní hmotnost, největší šířka/délka mozkovny, ... * můžeme je kategorizovat • jedna vlastnost / více vlastností najednou • —y jednorozměrné/vícerozměrné bodové/intervalové rozdělení četností Jednorozměrné bodové rozdělení četností • Příklad č.l, Příklad č.2: Úvodní práce s datovým souborem — jedna porodnice, novorozenci; údaje o porodní hmotnosti, vzdělání matky, pohlaví novorozence a počtu starších sourozenců — řádek ... údaje o jednom novorozenci ... objekt — sloupec .. .porodní hmotnost, vzdělání, pohlaví, počet st. sourozenců ... znaky — znak * konkrétní číslo, které má samo o sobě výpovědní hodnotu (porodní hmotnost) * kódování (0-žena, 1-muž); (1-ZS, 2-SS, 3-SSm, 4-VS) — znak vzděláni, resp. kategorizovaná por. hm —y kategoriální proměnná —y bodové rozdělení četností • Příklad č.3: Variační řada — Variační řada .. .tabulka obsahující pro každou (j-tou) variantu znaku X * absolutní četnost n j ■ kolik matek má ZŠ * relativní četnost p j ■ poměr matek se ZŠ vzd. ku celkovému počtu matek • pj * 100 - kolik % matek má ZŠ? * absolutní kumulativní četnost Nj ■ kolik matek má SŠm nebo nižší * relativní kumulativní četnost Fj ■ poměr matek se SŠm nebo nižší ku celkovému počtu matek • Fj * 100 - kolik % matek má SŠm nebo nižší? • Příklad č.4: Sloupcové grafy 1 Dvourozměrné bodové rozložení četností • Příklad č.5: KT simultánních absolutních a relativních četností — dva znaky .. .vzdělání matky (X; 4 varianty), porodní hmotnost (kat) (Y; 3 varianty) — —y 12 kombinací dvojic variant — kontingenční tabulka abs. četností nizka norma vysoká suma zs nu ™13 ni. ss ™23 n2. SSm ™32 ™33 n3. vs nA1 ™43 n>4. suma n.i n.2 n.3 n * rijk ... simultánní absolutní četnost dvojice znaků xy\ a ■ počet novorozenců s nízkou porodní hmotností a matkou se ZS * rij. ... marginální absolutní četnost varianty xy] ■ počet novorozenců, jejichž matka má ZŠ bez ohledu na jejich porodní hmotnost * n.fc ... marginální absolutní četnost varianty y\k\ ■ počet novorozenců s nízkou porodní hmotností bez ohledu na vzdělání matky — KT relativních četností ... KT abs. četností podělená celkovým počtem objektů • Příklad č.6: KT řádkově/sloupcově podmíněných relativních četností — Pk(j) ■ ■ ■ řádkově podmíněná relativní četnost varianty y^] za předpokladu var. xy] * PKí) = i~ * poměr novorozenců s nízkou porodní hmotností vzhledem k počtu novorozenců se ZŠ vzděláním matky — Pj(k) ■ ■ ■ sloupcově podmíněná relativní četnost varianty xy\ za předpokladu var. y\k\ * pm = i-k * poměr novorozenců se SS vzděláním matky vzhledem k počtu novorozenců s porodní hmotností v normě. Intervalové rozdělení četností • Příklad č.7, Příklad č.8: Histogram, Krabicový diagram — skelety ze starověké egyptské populace; id, (egyptská) populace, pohlaví, nej větší délka/šířka mozkovny v mm — největší šířka mozkovny u mužů ... spojitá proměnná —> intervalové rozdělení četností — spojitá data —> třídime je do stejně dlouhých třídicích intervalů (oo;iti) , (ui]U2), (ur;ur+1), (ur+1; oo) — (uj] Uj+i) ... j-tf třídicí interval — optimální počet intervalů ... Sturgesovo pravidlo r k 1 + 3.31og10n —y optimální šířka jednoho intervalu —y hranice intervalů 2