ÚKOL 8 cvičení z analýzy dat sociologického výzkumu Jméno a příjmení: Imatrik. ročník: 1. V datech EVS ČR 1999 zjistěte, zdali existuje vztah mezi preferencí svobody, či rovnosti (proměnná q52) a levopravou orientací (trichotomizovaná proměnná l-p). Příklad řešte prostřednictvím CROSSTABS. Před výpočtem rekódujte proměnnou q52 tak, aby nová stupnice zněla: 1. preference svobody, 2. ani svoboda, ani rovnost, 3. preference rovnosti. Po zjištění vztahu otestujte, co se s ním stane, když zavedete třetí proměnnou, a to věk (trichotomizovanou proměnnou VEK-KAT3). Řešení: Transform -- Recode -- Into different variable... Analyze -- Crosstabs... Statistics: Correlations (jde použít i jiné korelační koeficienty pro ordinální proměnné) Korelace -0,23, pravice má tendenci preferovat svobodu. Po zavedení věku se tento obraz trochu změní (viz tabulky níže): Analyze -- Descriptive statistics - Crosstabs ... Layer 1= vek_kat3 Korelace byla ve srovnání s bivariačním koeficientem nízká v mladé věkové skupině (což je dáno tím, že v této skupině nejsou rozdíly v názorech na svobodu), byla přibližně stejně vysoká ve střední věkové skupině a zvýšila se ve skupině nejstarší. Tam fungovalo vše, jak má. 2. Zkontrolujte, zdali stejné výsledky přinese také kontrola přes parciální koeficient. U proměnných věk a levice-pravice použijte nekategorizované proměnné -- vek a q53. Pokud vyšly výsledky jinak, pokuste se zdůvodnit, proč tomu tak je. Analyze -- Correlate -- Partial -- Variables: q52rec, q53. Controlling for: vek Options: Zero-order correlations P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - - Zero Order Partials Q53 Q52REC VEK Q53 1,0000 Q52REC -,2576** 1,0000 VEK -,1359** ,1535** 1,0000 P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - - Controlling for.. VEK Q53 Q52REC Q53 1,0000 Q52REC -,2418** 1,0000 Výsledky zde vyšly tak, že věk nemá na původní vztah žádný vliv. Tento odlišný výsledek je dán tím, že: 1. Proměnná q52rec není vhodná do výpočtu parciální korelace, protože není intervalová 2. nepracujeme zde s kategorizovanými znaky, ale s původními škálami. Napadá Vás, kolegové, ještě další příčina? 3. Zjistěte, jaká je korelace mezi názorem na minulý politický systém (proměnná q61) a na hodnocení současného systému (q60). Je tento vztah ovlivněn levo-pravou politickou orientací respondenta (q53)? Pokud ano, jaký model pro vliv této proměnné platí: zdánlivá korelace, intervenující proměnná, nebo upravený vztah? Řešení: Analyze-Correlate-Bivariate-Pearson Analyze-Correlate-Partial... Correlations Systém řízení Pol. systém za Control naší země komunistického Levice - Variables funguje: režimu pravice -none-(a) Systém řízení naší země funguje: Correlation 1,000 -,158 ,188 Significance . ,000 ,000 (2-tailed) df 0 1712 1712 Pol. systém za komunistického Correlation -,158 1,000 -,589 režimu Significance ,000 . ,000 (2-tailed) df 1712 0 1712 Levice - pravice Correlation ,188 -,589 1,000 Significance ,000 ,000 . (2-tailed) df 1712 1712 0 Levice - Systém řízení naší země funguje: Correlation 1,000 -,059 pravice Significance . ,014 (2-tailed) df 0 1711 Pol. systém za komunistického Correlation -,059 1,000 režimu Significance ,014 . (2-tailed) df 1711 0 a Cells contain zero-order (Pearson) correlations. Jelikož po zavedení testové proměnné (q53) se původní korelace výrazně snížila z --0,16 na --0,06, má levopravá orientace respondenta na původní vztah vliv. O jaký se jedná model? Mohla by to být intervenující proměnná (viz obr.) q61 q60 r = -0,12 q53 ale vzhledem k tomu, že korelace nezmizela úplně, půjde asi o upravený vztah. Zkontrolujeme tak, že si necháme udělat CROSSTABS třetího stupně q60 a q61, přičemž jako testovou proměnnou zavedeme kategorizovanou q53 (l-p). Nenecháme si udělat tabulku třídění, pouze korelace: Vidíme, že u levice se původní korelace dost zvýšila, zatímco u zbylých dvou kategorií je nízká, navíc s opačnými znaménky. 4. V souboru evropských zemí dmg-data.sav spočítejte korelaci pro kojeneckou úmrtnost (KOJEN_UM) a plodností (TFR= Total Fertility Rate, průměrný počet dětí na ženu). Očekávali bychom, že tam, kde je nízká kojenecká úmrtnost, (nízká kojenecká úmrtnost je chápána jako ukazatel dobré životní úrovně země), tam bude i nízká plodnost, neboť vyspělé země až dosud byly charakteristické nízkou plodností. Platí zjištěná korelace i pro východní a západní země (proměnná z_v)? Pokud ne, vysvětlete, jak je možné, že korelace nultého řádu byla jiná, než korelace prvního řádu? Jsou rozdíly v korelacích mezi východem a západem statisticky významné? (Pozor, toto je pouze cvičný výpočet, který by ve skutečné analýze neměl být ze dvou důvodů proveden. PROČ?) Řešení Analyze-Correlate-Bivariate-Pearson Nízká korelace nultého řádu, která není statisticky významná. Analyze-Descriptive statistics-Crosstabs. suppress tables. Layer1 = z_v... Statistics - Correlations V západních zemích je korelace záporná (čím vyšší kojenecká úmrtnost, tím nižší plodnost), ve východních zemích kladná (čím vyšší kojenecká úmrtnost, tím vyšší plodnost). Rozdíl mezi korelací nultého řádu a korelacemi prvního řádu spočívá ve velké heterogenitě souboru. Jestliže polovina zemí má středně silnou a kladnou korelaci a druhá polovina zemí středně silnou zápornou, výsledná korelace se vyruší, takže je blízká nule (znaménko tam pak není podstatné). Rozdíl v korelacích: Rozdíl vychází statisticky významný. Nelze brát výsledek vážně proto, že (1) nemáme výběrový soubor (data pocházejí z údajů za celou zemi) a (2) proto, že podmínkou je, že N nesmí být v ani jedné skupině menší než 20. A my máme 17.