LEKCE09 MĚŘENÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚNNÝMI: KORELAČNÍ KOEFICIENTY A GRAFY vzorový výsledek cvičení C9.1: a) Jak velkou byste očekávali souvislost mezi důležitostí Boha (q33) a četností motliteb k Bohu mimo církevní obřady (q36)? b) Potvrdilo se vám toto očekávání? Jaký koeficient jste pro výpočet použili a proč? c) Pokud ano, o čem to svědčí? d) Co znamená, že má vypočtený korelační koeficient záporné znaménko? e) Je tato korelace signifikantní? Řešení: a) Očekávali jsme vysokou korelaci a b) ona se potvrdila. Spearmana, jedna z proměnných je ordinální povahy. c) Svědčí to o tom, že respondenti jsou ve svých odpovědích konsistentní. d) Záporné znaménko znamená v daném případě kladnou korelaci: čím je Bůh důležitější, tím častěji se respondent modlí k Bohu i mimo církevní obřady (a naopak). Poznámka: Pozor, znaménko znamená směr vztahu, ale formální směr vztahu. Ve skutečnosti záporné znaménko tohoto vztahu říká pouze: KDYŽ ROSTE HODNOTA JEDNÉ ŠKÁLY, KLESÁ HODNOTA DRUHÉ. Musíme vzít vždy v potaz natočení škál. U q33 důležitost boha na škále 1-10 stoupá a u q36 frekvence modlení na škále 1-7 klesá. Kdybychom změnili pořadí u jedné ze škál (např. 1 by reprezentovala nejvyšší a ne nejnižší význam boha), bylo by výsledné znaménko kladné. PROTO JE VĚTA "čím je Bůh důležitější, tím častěji se respondent modlí k Bohu i mimo církevní obřady" JIŽ INTERPRETACÍ ZJIŠTĚNÉHO VZTAHU. e) Ano, korelace je signifikantní - viz sig. (2-tailed) = .000. C9.2: a) Do jaké míry souvisí postoje v baterii q54a -- q54h se vzděláním respondenta (ISCED1)? Výpočet udělejte jako obdélníkovou matici, v níž vzdělání je nezávisle proměnnou. Formát výstupního výpočtu přetvořte tak, aby vzdělání bylo umístěno ve sloupci a závisle proměnné v řádcích. b) Jaký koeficient jste pro výpočet použili a proč? c) S jakou proměnnou v dané baterii vzdělání nejvíce koreluje? Jaký je příslušný koeficient determinace? d) A s jakou proměnnou naopak vzdělání koreluje nejméně? e) Proč jsou některé korelace kladné a některé záporné? Řešení: a) Výsledkem je tato matice. b) Použili jsme Spearmenův koeficient pořadové korelace. Nejde o kardinální proměnné (nelze použít Pearsonův korelační koeficient) a tabulky nejsou ani čtvercové, neboť vzdělání má jiný počet variant (nelze použít Kendallovo taub) než ostatní proměnné. c) Nejvíce je závislý na vzdělání názor o vyrovnanosti příjmů (q54e),. Spearmanův koeficient je 0,205. Je kladný, takže čím vyšší vzdělání (je seřazeno od nejnižšího k nejvyššímu), tím více se respondenti přiklánějí k názoru, že by se mělo více podnítit úsilí jednotlivce a naopak, čím nižší vzdělání, tím více se respondenti přiklánějí k názoru, že příjmy by měly být vyrovnanější. d) Nejméně je závislý na vzdělání názor o vyrovnanosti příjmů (q54e),, Spearmanův koeficient je 0,024 (je to tak málo, že de facto o žádný vztah nejde, rozložení odpovědí v jednotlivých vzdělanostních kategoriích je přibližně stejné. e) Protože vztah má v konkrétních případech různý směr (pozitivní = čím vyšší vzdělání, tím více roste škálová hodnota druhé škály; negativní = čím nižší roste vzdělání, tím více roste škálová C9.3: V otázce q62 lidé posuzovali svůj postoj k různým typům politických systémů. Jak spolu tyto postoje korelovaly (zvolte dobře koeficient)? Popište základní zjištění. Řešení: a) Volili jsme Kendallovo tau[b], protože všechny škály mají stejný rozsah a proto všechny kontingenční tabulky budou čtvercové. b) Korelace mezi proměnnými byla spíše slabší, jen: ˙ mezi preferencí vlády armády a preferencí silného vůdce byla středně silná asociace (0,264) - pozitivní, což znamená, že preference jednoho byla spojena s preferencí druhého) ˙ mezi preferencí demokracie a preferencí silného vůdce byla nalezena středně silná asociace (-0,264) - negativní, což znamená, že preference jednoho byla spojena s odmítáním druhého) C9.4: Podívejte se na souvislosti (zvolte dobře koeficient) mezi znepokojením nad životními podmínkami osob podle toho jak jsou nám blízcí či vzdálení (q79). Dovedli byste zde odhalit nějakou tendenci (napovím, že se zde rýsují přinejmenším dva, možná tři typy respondentů - víte co mám na mysli)? Řešení: Zdá se, že se vytvářejí dva typy respondentů. a) Jedni jsou orientováni, co se týče obav o životní podmínky ostatních, spíše na své nejbližší - příbuzné a sousedy (žlutá barva). b) Druzí jsou orientováni regionálně (zelená barva). c) Třetí jsou orientováni globálně (modrá barva). Poznámka: Obecně je výklad následující: Čím častěji je člověk znepokojen osudem svých příbuzných, tím častěji je současně znepokojen i osudem svých sousedů (0,599). Slabší je vazba mezi znepokojením s osudem příbuzných a s osudem lidí z regionu (0,293), ještě slabší co se týče znepokojení osudem obyvatel ČR (0,167) a Evropy (0,169) a téměř žádný vztah nenacházíme mezi znepokojením s osudem lidstva (0,018, vztah se blíží 0 a tak by se dalo takřka říci, že z těch, kdo jsou znepokojeni osudem příbuzných je osudem lidstva polovina znepokojena a polovina ne). C9.5: V minulém cvičení jste testovali nulovou hypotézu, že mezi hrdostí na to být občanem ČR (q71) a preferencí místa, k němuž respondenti pociťují největší příslušnost (q67) není žádná souvislost. Pokuste se nyní o vztahu rozhodnout na základě příslušného koeficientu asociace. Jaký koeficient zvolíte a proč? O co je nyní vaše informace bohatší? Řešení: a) Pokud budeme vztah považovat za symetrický (jde o ordinální proměnné), je možné zvolit např. Kendalovo tau[c] (tabulka je 5x4) nebo Spearmana. Korelace je ale nízká (v případě Kendallova tau 0,015 a v případě Spearmana je 0,020), navíc nesignifikantní (v případě Kendallova tau je sign. 0,407 a v případě Spearmana je 0,390). Nízkou korelaci dokládá i rozložení dat v tabulce, viz první řádek dat v tabulce příslušného cvičení k lekci 8 (ať je člověk hrdý více nebo méně, pociťuje nejsilnější příslušnost k k obci, v níž žije). Oproti informaci vyvozené z rozložení či chí-kvadrátu nám dává koeficient asociace informaci i o (velmi malé) síle asociace. Poznámka: Signifikance varují, že odmítneme-li nulovou hypotézu (o neexistenci vztahu v populaci), činíme to s vysokým rizikem chyby. V případe Kendallova tau 41% riziko, v případě Spearmanova koeficientu 39% riziko. b) Pokud bychom považovali vztah za asymetrický, museli bychom použít např. Somersovo D: Ani zde však nenacházíme téměř žádnou asociaci, ať již vybereme jako nezávislou jednu či druhou proměnnou. A i zde signifikance varují, že odmítneme-li nulovou hypotézu (o neexistenci vztahu v populaci), činíme to s vysokým rizikem chyby..