ÚKOL 9 cvičení z analýzy dat sociologického výzkumu Jméno a příjmení: Imatrik. ročník: 1. V datech dmg-data vypočítejte regresní rovnici pro vztah mezi podílem osob ve věku nad 65 let a mírou urbanizace (předpokládáme, že s mírou urbanizace země, která je indikátorem modernity, se bude zvyšovat podíl osob starších 65 let). Zjistěte, zdali má smysl pracovat s celým souborem, nebo zdá má cenu uvažovat pouze o nějakém podsouboru zemí. Řešení: Nejdříve zjistíme graficky, zdali je vztah lineární povahy: Scatter graph Linearita je v souboru všech zemí slabá (Rsq je pouze 0,32). Podsoubor západních zemí: Linearita velmi nízká. Podsoubor východních zemí: Linearita slušná. Regrese: Analyze-Regression-Linear Rovnice: podíl nad 65 let = 1,08 + 0,185*urbanizace Zvýší-li se podíl lidí žijících ve městech o 1 procento, zvýší se podíl osob starších 65 let o 0,19%. 2. Vyjděte z příkladu 1 a zjistěte, které z východoevropských zemí se ve svých predikovaných hodnotách nejvíce liší od hodnot skutečných? Nejvíce se liší Albánie, kde je podíl lidí nad 65 o 3,5 % nižší než predikovaný podle našeho regresního modelu. Dále se pak hodně liší Bulharsko, Jugoslávie a Maďarsko. 3. Jak se změní obraz linearity, když z celého souboru evropských zemí vyloučíte největší outliers: Albánii, Moldávii a Island? Ve srovnání se souborem všech zemí téměř nijak. Rsq je pořád nízké, 0,33 (pro celý soubor bylo 0,32).