Pearsonův test dobré shody chí kvadrát n[ei] četnosti experimentální n[oi] četnosti očekávané (teoretické) Test se nehodí pro soubory s velmi malými četnosti v jednotlivých kategoriích!!! Zde je vhodnější Kolmogorovův test. Pozor!!! Všimněte si analogie mezi párovým testem (t-test, Wilcoxon) a testy shody (Smirnov, test dobré shody): v obou případech se sledují rozdíly mezi párovými hodnotami. III. Závislost • Funkční • Stochastická • Korelační • Regresní » Lineární » Nelineární Závislost dvou proměnných • Grafické nebo tabelární zobrazení dat • Hledání základních konfigurací a tendencí v datech • Výpočet numerických charakteristik Závislost dvou proměnných rozptylový graf (scatter plot) kvadranty Závislost dvou proměnných Pearsonův koeficient korelace Pearsonův koeficient korelace • Vyjadřuje pouze sílu lineárního vztahu. • Je velmi ovlivněn odlehlými hodnotami. • Nerozlišuje mezi závisle a nezávisle proměnnou. • Obě proměnné musí mít náhodný charakter. • Korelace sama o sobě neznamená přítonmost příčinného vztahu!!! Odhad a testování Pearsonova k. k. [• ]H[0]: r = 0[] Odhad a testování Pearsonova k. k. [• ]H[0]: r = ρ[0][] Odhad a testování Pearsonova k. k. Pořadová korelace • Spearmanův Hodí se spíše pro zařazovací ordinální data, pro zařazovací ordinální data se však běžně používá. D[i] jsou rozdíly v pořadí hodnot x[i] a y[i] vzhledem k ostatním hodnotám výběru. • Kendallův Sleduje počet a charakter rozdílů v pořadí - pro j > i: y[j] > y[i ]konkordance (kladná asociace) P y[j] < y[i ]diskordance (kladná asociace) Q Hodí se spíše pro porovnávací ordinální data Druhy korelace • Formální korelace: u percentuálních dat • Korelace způsobená společnou příčinou • Korelace způsobená nehomogenitou Závislost a asociace nominálních dat Kontingenční tabulky čtyřpolní tabulka – pro dichotomická data Asociace v kontingenčních tabulkách Asociace v kontingenčních tabulkách Fisherův exaktní (kombinatorický) test – pro malé četnosti Asociace v kontingenčních tabulkách Woolfův G test nezávislosti Koeficienty asociace • Yule: • Simple matching (pozorovaná shoda): • Rusell – Rao: • Rogers – Tanimoto: • Sneath: Koeficienty asociace • Jaccard: • Kulczynski 1: • Sorensen – Dice: • Anderberg: • Ochiai – Otsuka: Kontingenční tabulky Chí kvadrát test nezávislosti Asociace v kontingenčních tabulkách Koeficienty kontingence - odvozené od koeficientu χ ^2, pro čtyřpolní tabulky jsou shodné s koeficientem Φ. Cramerův koeficient kontingence Čuprovův koeficient kontingence Asociace ordinálních kategorií • Goodmanův – Kruskalův koeficient • Kendallovo tau-c kde m je menší z obou dimenzí v kontingenční tabulce. Testy shody pro párová dichotomická data Dichotomická data: Mc Nemarův test Dichotomická data: srovnání 2 metod • Kappa koeficient shody Nominální data: Bowkerův test symetrie Zobecnění McNemarova testu pro nominální znak s r úrovněmi: