1 SOC108/708 LEKCE 9: MĚŘENÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚNNÝMI: KORELAČNÍ KOEFICIENTY A GRAFY (c) Petr Mareš a Ladislav Rabušic 2002 LEKCE09 MĚŘENÍ (SÍLY) ASOCIACE MEZI DVĚMA SPOJITÝMI PROMĚNNÝMI: KORELAČNÍ KOEFICIENTY A GRAFY SÍLA ASOCIACE ? Je dána rozdíly mezi jednotlivými variantami proměnné. ? Měříme ji speciálními statistickými koeficienty asociace. ? Jednotlivé úrovně měření (nominální, ordinální, kardinální) a některé typy znaků (znaménkové znaky ap.) mají své specifické koeficienty. ? Použití koeficientů je ovlivněno i velikostí kontingenční tabulky (své koeficienty mají čtyřpolní tabulky vyjadřující vztah dvou dichotomických znaků). K měření síly statistické závislosti MEZI PROMĚNNÝMI (vazby, souvislosti, asociace) jsou určeny sumarizační statistiky nazývané ASOCIAČNÍ ČI KORELAČNÍ KOEFICIENTY (koeficienty, závislosti, explanační síly ap.). Tyto koeficienty podávají souhrnnou informaci o existenci vztahů mezi proměnnými a o jejich síle. KOEFICIENTY ASOCIACE K jejich základním charakteristikám KOEFICIENTŮ ASOCIACE patří, že: ? Hodnoty koeficientů se většinou pohybují v intervalech: ? <0;1> Příklad: Mezi volbou politické strany a subjektivní třídou existuje silný vztah. Koeficient vypovídá o síle tohoto vztahu, nikoliv o jeho směru (u nominálního znaku jako je politická strana nemá směr smysl). ? <-1;+1> Příklad: "S růstem vzdělání roste výše platu (pozitivní vztah) nebo naopak (negativní vztah). Koeficient vypovídá o síle tohoto vztahu, znaménko o jeho směru. ? Čím vyšší je hodnota koeficientů (v absolutní hodnotě), tím silnější je vztah. ? Znaménko určuje směr vztahu (koeficienty pro ordinální a kardinální proměnné). Záporné koeficienty znamenají negativní asociaci a kladné koeficienty pozitivní asociaci. Znaménko neříká nic o síle vztahu (o té vypovídá absolutní hodnota koeficientu). ? Nula má obvykle význam neexistence vztahu (někdy ovšem, jak jsme již viděli, je však jen výrazem toho, že vztah sice existuje, ale je nelineární). ? Hodnota 1,00 má význam existence perfektního vztahu. Příklad: ŽÁDNÁ STŘEDNÍ PERFEKTNÍ ASOCIACE ASOCIACE ASOCIACE 65% 65% 30% 75% 0% 100% 35% 35% 70% 25% 100% 0% korelace 0,000 korelace 0,500 korelace 1,000 PAMATUJME SI! ? Pro každou úroveň měření (nominální, ordinální a kardinální) jsou určeny zvláštní koeficienty. ? Máme-li proměnné různého charakteru (například nominální a kardinální), musíme volit vždy koeficient pro proměnnou nižší úrovně (v tomto případě nominální). ? V některých případech jsou pro takový případ vyvinuty speciální koeficienty (pro zmíněný případ je to například koeficient eta). ? Některé z koeficientů lze použít jen při lineárním vztahu, jiné i pro vztahy nelineární. ? Některé koeficienty rozlišují, která z proměnných je závisle a která nezávisle proměnná (asymetrické), jiné to nerozlišují (symetrické). ? Některé dokonce rozlišují i velikost kontingenční tabulky. ? Prokázání asociace není důkazem kauzality vztahu. KOEFICIENTY MÍRY ASOCIACE PRO DVĚ RŮZNÉ ÚROVNĚ MĚŘENÍ Jestliže jedna proměnná je nominální a druhá ordinální nebo kardinální, nebo je-li jedna proměnná ordinální a druhá kardinální, existují celkem tři možnosti jak vybrat pro měření síly asociace mezi nimi vhodný koeficient. ? Použijeme KOEFICIENTU PRO NIŽŠÍ ÚROVEŇ MĚŘENÍ (proměnnou vyšší úrovně měření lze vždy transformovat v proměnnou nižší úrovně měření, nikoliv však naopak). Musíme si být vědomi toho, že tím ztrácíme část informací. ? Jestliže jedna z proměnných má jen 2 varianty (DICHOTOMICKÉ PROMĚNNÉ), můžeme ignorovat její úroveň měření a volbu koeficientu určí druhá (nedichotomická) proměnná. ? Použijeme SPECIÁLNĚ PRO TENTO PŘÍPAD VYVINUTÝCH KOEFICIENTŮ. Příkladem je ETA KOEFICIENT, který může být použit, když závisle proměnná je měřena na intervalové nebo dlouhé ordinální škále a nezávisle proměnná na nominální škále. PŘEHLED KOEFICIENTŮ MÍRY ASOCIACE ÚROVEŇ MĚŘENÍ VHODNÁ VHODNÝ INFERENČNÍ A VELIKOST METODA KOEFICIENT STATISTIKA TABULEK NOMIN 2x2 kontingenčn Phí, Yules Q chí-kvadrát ÁLNÍ í Goodmanoovo a NOMIN tabulka Kruskalovo tau ÁLNÍ NOMIN 3 a kontingenčn Lambda, chí-kvadrát ÁLNÍ více x í Goodmanoovo a NOMIN 2 a tabulka Kruskalovo ÁLNÍ více tau, Cramerovo V NOMIN nominál kontingenčn Theta, Mann-Whitney ÁLNÍ ní í Goodmanoovo a U test ORDIN s 3 a tabulka Kruskalovo (dichotomická ÁLNÍ více tau, nominální Cramerovo V nezávislá); K- sample median test Kruskal- Wallis NOMIN nominál kontingenčn Eta (korelační F-test ÁLNÍ ní í poměr); lze i (ONEWAY) KARDI nezávis tabulka* Goodmanovo a chí-kvadrát NÁLNÍ lá porovnání Kruskallovo průměrů* tau, Cramerovo F-test V, Eta (ONEWAY) ORDIN obě s kontingenčn Gamma, test ÁLNÍ málo í Kendallovo významnosti ORDIN variant tabulka taub** , pro Gamma ÁLNÍ ami Kendallovo test tauc významnosti pro tau ORDIN jedna pořadová Kendallovo tau test ÁLNÍ s mnoha korelace významnosti ORDIN variant pro tau ÁLNÍ ami ORDIN obě pořadová Kendallovo tau testy ÁLNÍ s mnoha korelace Spearmanovo ró významnosti ORDIN variant pro tau a pro ÁLNÍ ami ró ORDIN obě s kontingenčn Eta, Gamma F-test ÁLNÍ málo í Kendallovo tau KARDI variant tabulka*** NÁLNÍ ami ORDIN ordinál porovnání Eta F-test ÁLNÍ ní s průměrů Kendallovo tau test KARDI málo pořadová významnosti NÁLNÍ variant korelace pro tau ami ORDIN obě s pořadová Kendallovo testy ÁLNÍ mnoha korelace tau, významnosti KARDI variant Spearmanovo ró pro tau a pro NÁLNÍ ami ró KARDI obě s kontingenčn Pearsonovo R test NÁLNÍ málo í tabulka významnosti KARDI variant pro R NÁLNÍ ami KARDI nejméně scattegram Pearsonovo R, NÁLNÍ jedna s regrese regresení KARDI mnoha koeficienty NÁLNÍ variant ami *podle počtu variant kardinální proměnné ** taub pro čtvercovou tabulku *** pokud je kardinální závislá Vaus, D. A. de: Surveys in Social Research. Unwin Hyman, London 1990, p.182. KORELAČNÍ MATICE