Cviko 8.3. 1) Vytvořte databázi Katan2, která obsahuje proměnné Věk a Pohlaví, kde věk musí být nižší než 60 let. Proměnné následně přejmenujte na anglické ekvivalenty. Katan2 <- Katan %>% select(Věk, Pohlaví) %>% filter(Věk < 60) %>% rename("Age" = Věk, "Gender" = Pohlaví) 2) Bylo zjištěno, že věk jedinců v databázi je vždy o jeden rok nižší, než by měl být. Napravte tuto chybu. Katan2$Age <- Katan2$Age + 1 Katan2 <- mutate(Katan2, VekPlus = Age + 1) Katan2 <- mutate(Katan, Věk = Věk + 1) vs Katan_new <- transmute(Katan, VěkPlus = Věk + 1) 3) Spolu Nyní budeme chtít vytvořit v rámci databáze Katan novou proměnnou s názvem VěkSkupiny. Ta by měla náš soubor dat rozdělit do následujících čtyř skupin (dospělá žena, dospělý muž, nezletilá slečna, nezletilý kluk). Katan2 <- mutate(Katan, VěkSkupiny = if_else( Katan$Věk >= 18 & Katan$Pohlaví == "žena","dospělá žena", if_else( Katan$Věk>=18 & Katan$Pohlaví == "muž", "dospělý muž", if_else( Katan$Věk<18 & Katan$Pohlaví == "žena", "nezletilá slečna", if_else( Katan$Věk<18 & Katan$Pohlaví == "muž", "nezletilý kluk", "NA"))))) 4) Spolu group by Katan2 %>% group_by(VěkSkupiny) %>% summarise(průměr = mean(Věk), sd = sd(Věk), min = min(Věk), max = max(Věk), četnost = n()) Katan2 %>% group_by(VěkSkupiny, Klub) %>% summarise(průměr = mean(Věk), sd = sd(Věk), min = min(Věk), max = max(Věk), četnost = n()) 5) Příklad Zjistěte v následujících věkových skupinách (teenager do 18 let, dospělý od 18 do 26 let, dospělý od 26 do 35 let, dospělý od 35 do 65 let, důchodce 65 let a více) zastoupení mužů a žen (v absolutních číslech i to relativní v procentech) a jejich průměrný počet partií na osobu. Ve skriptu využijte příkaz trubka. Katan2 <- Katan %>% mutate(VěkSkupiny = cut(Věk, breaks = c(0, 18, 26, 35, 65, 100), right = FALSE, labels = c("teenager do 18 let", "dospělý od 18 do 26 let", "dospělý od 26 do 35 let", "dospělý od 35 do 65 let", "důchodce 65 let a více"))) %>% group_by(Pohlaví, VěkSkupiny) %>% summarise(Četnost_abs = n(), Četnost_rel = n()/nrow(Katan)*100, Průměr = mean(Partie)) Katan %>% group_by(Pohlaví, Práce) %>% summarise(průměr_Věk = mean(Věk), sd_Věk= sd(Věk), min_Věk= min(Věk), max_Věk= max(Věk), průměr_Děti = mean(Děti), sd_Děti = sd(Děti), min_Děti = min(Děti), max_Děti = max(Děti)) - zjednodušení Katan %>% group_by(Pohlaví, Práce) %>% summarise_each(funs(mean, sd, min, max), Věk, Děti) 6) Zjistěte průměr, medián a směrodatnou odchylku u proměnných Partie a Věk. Hodnoty určete pro skupiny rozřazené dle proměnných Vzdělání a Pohlaví (tj. ZŠ - muž, ZŠ - žena, SŠ - muž, SŠ - žena atd.). Ve skriptu využijte příkaz trubka. Katan %>% group_by(Vzdělání, Pohlaví) %>% summarise_each(funs(mean, median, sd), Partie, Věk)