1 Bodové a intervalové rozdělení četností Příklad 1.1. Načtěte soubor znamky.txt. Znakům X, Y, Z vytvořte návěští (X - známka z matematiky, Y - známka z angličtiny Z - pohlaví studenta). Popište, co znamenají jednotlivé varianty (u znaků X a Y: 1 - výborně, 2 -chvalitebně, 3 - dobře, 4 - neprospěl, u znaku Z: 0 - žena, 1 - muž). ## matematika angličtina pohlavi ## 1 chvalitebné chvalitebné zena ## 2 výborne dobre muz ## 3 nedostatečné dobre muz ## 4 výborne výborne zena ## 5 výborne chvalitebné muz ## 6 nedostatečné nedostatečné muz Příklad 1.2. Vytvořte a) variační řadu známek z matematiky a známek z angličtiny; b) sloupkový diagram absolutních četností znaků X=Matematika a Y=Angličtina; c) polygon absolutních četností znaků X=Matematika a Y=Angličtina. a) Variační řada známek z matematiky ## nj Nj pj Fj ## výborne 7 7 0.35 0.35 ## chvalitebné 3 10 0.15 0.50 ## dobre 2 12 0.10 0.60 ## nedostatečné 8 20 0.40 1.00 Variační řadu můžeme také získat použitím funkce variacni_rada(X, názvy), která je naprogramovaná ve skriptu AS-funkce. ## výborne ## chvalitebné ## dobre ## nedostatečné nj NJ PJ FJ 7 7 0.35 0.35 3 10 0.15 0.50 2 12 0.10 0.60 8 20 0.40 1.00 Variační řada známek z angličtiny ## nj Nj pj Fj ## výborne 4 4 0.20 0.20 ## chvalitebné 4 8 0.20 0.40 ## dobre 7 15 0.35 0.75 ## nedostatečné 5 20 0.25 1.00 b) Sloupkový diagram absolutních četností znaků X=Matematika a Y=Angličtina 1 Sloupkový diagram pro predmet matematika Sloupkový diagram pro predmet angličtina výborné chvalitebné dobré nedostatečné výborné chvalitebné dobré nedostatečné Známka Známka c) Polygon četností Polygon četnosti pro predmet matematika Polygon četnosti pro predmet angličtina výborné chvalitebné dobré nedostatečné výborné chvalitebné dobré nedostatečné Známka Známka Příklad 1.3. Vytvořte variační řady známek z matematiky a angličtiny pouze a) pro ženy b) pro muže. a) Variační řada známek z matematiky pro ženy ## nj Nj pj Fj ## výborne 5 5 0.50.5 ## chvalitebné 2 7 0.2 0.7 ## dobre 1 8 0.1 0.8 ## nedostatečné 2 10 0.2 1.0 Variační řada známek z angličtiny pro ženy 2 ## nj Nj pj Fj ## výborne 4 4 0.4 0.4 ## chvalitebné 2 6 0.2 0.6 ## dobre 1 7 0.1 0.7 ## nedostatečné 3 10 0.3 1.0 b) Variační řada známek z matematiky pro muže ## nj Nj pj Fj ## výborne 2 2 0.20.2 ## chvalitebné 1 3 0.1 0.3 ## dobre 1 4 0.1 0.4 ## nedostatečné 6 10 0.6 1.0 Variační řada známek z angličtiny pro muže ## nj Nj pj Fj ## výborne 0 0 0.00.0 ## chvalitebné 2 2 0.2 0.2 ## dobre 6 8 0.60.8 ## nedostatečné 2 10 0.2 1.0 Příklad 1.4. Nadále budeme pracovat s celým datovým souborem. Vytvoříme kontingenční tabulku simultánních absolutních četností znaků X a Y. ## výborne chvalitebné dobre nedostatečné suma ## výborne 4 12 0 7 ## chvalitebné 0 2 1 0 3 ## dobre 0 0 1 12 ## nedostatečné 0 13 4 8 ## suma 4 4 7 5 20 Vidíme, že ve výběrovém souboru byli 4 studenti, kteří měli z obou předmětů "výborně", jeden student, který měl z matematiky "výborně"a z angličtiny "chvalitebně"atd. až 4 studenti, kteří z obou předmětů neprospěli. Příklad 1.5. Vytvořte kontingenční tabulku řádkově a sloupcově podmíněných relativních četností znaků X=Ma-tematika a Y=Angličtina. ## angličtina ## matematika výborne chvalitebné dobre nedostatečné ## výborne 0.571 0.143 0.286 0.000 ## chvalitebné 0.000 0.667 0.333 0.000 ## dobre 0.000 0.000 0.500 0.500 ## nedostatečné 0.000 0.125 0.375 0.500 Interpretace např. 2. sloupce ve 4. řádku: V souboru bylo 8 studentů, kteří neprospěli z matematiky. Mezi nimi byl jeden, který měl velmi dobře z angličtiny, což představuje 1/8 = 12.5%. ## angličtina ## matematika výborne chvalitebné dobre nedostatečné ## výborne 1.000 0.250 0.286 0.000 ## chvalitebné 0.000 0.500 0.143 0.000 ## dobre 0.000 0.000 0.143 0.200 ## nedostatečné 0.000 0.250 0.429 0.800 Interpretace např. 4. řádku ve 2. sloupci: V souboru byli 4 studenti, kteří měli velmi dobře z angličtiny. Mezi nimi byl jeden, který neprospěl z matematiky, což představuje 1/4 = 25%. 3 Intervalové rozdělení četností Práci s intervalovým rozložením četností si ukážeme na datovém souboru lebky.txt. Popis datového souboru: Máme k dispozici údaje o rozměrech lebek staroegyptské populace. Jedná se o 216 mužů a 109 žen. Znak X ... největší délka mozkovny v mm (tj. přímá vzdálenost kraniometrických bodů glabella a opisthocranion) Znak Y ... největší šířka mozkovny v mm (tj. přímá vzdálenost kraniometrických bodů euryon dx a euryon sin) Znak Z ... pohlaví osoby (1-muž, 0-žena) Příklad 1.6. Načtěte soubor lebky.txt. Podle Sturgersova pravidla najděte optimální počet třídicích intervalů pro znaky X a Y a vhodně stanovte meze třídicích intervalů, a to zvlášť pro muže a zvlášť pro ženy. ## délka sirka pohlaví ## 1 188 145 muž ## 2 172 139 muž ## 3 176 138 muž ## 4 184 128 muž ## 5 183 139 muž ## 6 177 143 muž Muži ## [1] 9 Protože mužů je 216, podle Sturgersova pravidla je optimální počet třídicích intervalů 9. Musíme zjistit minimum a maximum, abychom vhodně stanovili meze třídicích intervalů. Délka lebky ## [1] 164 199 ## [1] 35 ## [1] 4 Pro znak X = Délka lebky je minimum 164 a maximum 199, rozsah těchto hodnot je 35 a ideální délka jednoho třídicího intervalu vyšla jako 199~164 « 4. Jeví se vhodné dolní mez prvního třídicího intervalu zvolit 163, horní mez posledního třídicího intervalu 199. Celkem třídicí intervaly pro znak X budou: (163,167), (167,171), (195,199). Šířka lebky ## [1] 124 149 ## [1] 25 ## [1] 3 Pro znak Y = šířka lebky je minimum 124 a maximum 149, rozsah těchto hodnot je 25 a ideální délka jednoho třídicího intervalu vyšla jako 149~124 « 3. Jeví se vhodné dolní mez prvního třídicího intervalu zvolit 123, horní mez posledního třídicího intervalu 150. Celkem třídicí intervaly pro znak X budou: (123,126), (126,129), (147,150). Ženy ## [1] 8 Protože žen je 109, podle Sturgersova pravidla je optimální počet třídicích intervalů 8. Postup je analogický jako u mužů. Délka lebky 4 ## [1] 157 188 ## [1] 31 ## [1] 4 Pro znak X = Délka lebky je minimum 157 a maximum 188, rozsah těchto hodnot je 31 a ideální délka jednoho třídicího intervalu vyšla jako 188 g157 w 4. Jeví se vhodné dolní mez prvního třídicího intervalu zvolit 156, horní mez posledního třídicího intervalu 188. Celkem třídicí intervaly pro znak X budou: (156,160), (160,164), (184,188). Šířka lebky ## [1] 118 146 ## [1] 28 ## [1] 4 Pro znak Y = šířka lebky je minimum 118 a maximum 146, rozsah těchto hodnot je 28 a ideální délka jednoho třídicího intervalu vyšla jako 146~118 « 4. Jeví se vhodné dolní mez prvního třídicího intervalu zvolit 116, horní mez posledního třídicího intervalu 148. Celkem třídicí intervaly pro znak X budou: (116,120), (120,124), (144,148). Příklad 1.7. Vytvořte histogram pro X a pro Y (s uvedenými absolutními a relativními četnostmi jednotlivých třídicích intervalů), a to zvlášť pro muže a zvlášť pro ženy. Histogram délky lebky u muzu Histogram sirky lebky u muzu 1-1-1-1-1-1-1-1-1-1 1-1-1-1-1-1-1-1-1-1 163 171 179 187 195 123 129 135 141 147 Délka lebky sirka lebky Pro ženy je postup analogický jako pro muže. 5 259999999999^ Histogram délky lebky u zen Histogram sirky lebky u zen i i i i i i i i i i i-1-1-1-1-1-1-1 156 160 164 168 172 176 180 184 188 116 120 124 128 132 136 140 144 148 □elka lebky sirka lebky