11 Korelační analýza • PŘEDPOKLAD: DVOUROZMĚRNÁ NORMALITA DAT -> Grafické ověření: Tečkový graf + elipsa spolehlivosti 11.1 Pořadová nezávislost • Dvourozměrný náhodný výběr (Xi, Yi), ..., (Xn, Yn) • Ri ... pořadí hodnot náhodné veličiny X • Qi ... pořadí hodnot náhodné veličiny Y • Spearmanův koeficient pořadové korelace Rg • cor(X, Y, method='spearman') 11.1.1 Testy o pořadové nezávislosti • Hq : X a Y jsou pořadově nezávislé. ... Hq : p = 0 • Hi : X a Y nejsou pořadově nezávislé. ... Hi : p ^ 0 1. Exaktní test (n < 30) • Testovací statistika To = \R,s\ • Kritický obor: W = (k; 1) —y tabulky 2. Asymptotický test (n > 20) • Testovací statistika Tn = —. y/T=Ws • Kritický obor: W = (—oo ; ta/2(n — 2)) U (ŕi_a/2(w — 2); oo) - ta/2(n-2) .. .qt(alpha/2, n-2) • p-hodnota = 2min{Pr(To < to),Pr(To > to)} - 2*min(pt(t0, n-2), l-pt(t0, n-2)) 3. Asymptotický test (n > 30) • Testovací statistika To = Rsy/n — 1 • Kritický obor: W = (—oo ; ua/2) U {ui_a/2 ; oo) - ua/2 ... qnorm(alpha/2) • p-hodnota = 2min{Pr(To < ío))Pr(7o > ^o)} - 2*min(pnorm(t0), l-pnorm(tO)) • Rse(-1; 1) 1 162 Kritické hodnoty pro Spearmanův koeficient pořa dové korelace n = 5, 6,... ,30, a = 0,05. n kritická hodnota 5 0,9 6 0,8286 7 0,745 8 0,6905 9 0,6833 10 0,6364 11 0,6091 12 0,5804 13 0,5549 14 0,5341 15 0,5179 16 0,5 17 0,4853 18 0,4716 19 0,4579 20 0,4451 21 0,4351 22 0,4241 23 0,415 24 0,4061 25 0,3977 26 0,3894 27 0,3822 28 0,3749 29 0,3685 30 0,362 Zdroj: [2], Tab. XVIII.6. 11.2 Lineární nezávislost • Výběrový (Pearsonův) koeficient korelace R12 T3 _ S™ -«12 — c c , kde 5*12 je kovariance, S± je směrodatná odchylka výběru X, S2 je sm. odchylka výběru Y • R12 E (-1; 1) • cor(X, Y, method='pearson') 11.2.1 Testy o lineární nezávislosti • Hq : X a Y jsou lineárně nezávislé. ... Hq : p = 0 • Hi : X a Y nejsou lineárně nezávislé. ... Hi : p ^ 0 1. Exaktní přístup • Testovací statistika T0= Rl2 V^2 V1 - R12 Kritický obor: W = (—oo ; ta/2{n — 2)) U {ti-a/2(n — 2); oo). - ta/2(n-2) .. .qt(alpha/2, n-2) Interval spolehlivosti (dh,hh)-ť ta/Án-2) ■ íW2(n-2) • !!! Hq zamítáme, pokud R12 ^ IS !!! • p-hodnota = 2min{Pr(T0 < í0)>Pr(^o > ^o)} - 2*min(pt(t0, n-2), l-pt(tO, n-2)) 2. Asymptotický přístup • Z-transformace Z = - ln ———— 2 1 - R12 • Interval spolehlivosti 4- V, / -7 Ml-«/2 , «l-a/2 \Jn — 3 ' v7^ — 3 !!! Hq zamítáme, pokud p = 0 ^ IS !!! 1 11.3 Test o dvou korelačních koeficientech • dva nezávislé náhodné výběry o rozsazích n a n* s korelačními koeficienty p a p* • H0:p = p*^p-p*=š, í G (-2; 2) • H^.pÝP^p-p^í, í G (-2; 2) • Z-transformace Z = - ln ■ ^ 12 2 1 - R 12 Z-transformace Z* testovací statistika ln l + Rl 12 2 l-Rh u Z - Z* n — 3 n* — 3 • kritický obor W = (—oo ; wa/2) U (ui_a/2 ; oo) — wa/2 ... qnorm(alpha/2) 11.4 Interpretační tabulka hodnot Spearmanova a Pearsonova korelačního koeficientu Abs.hod. korel.koef. Interpretace hodnoty 0 pořadová (lineární) nezávislost (0;0.1) velmi nízký stupeň závislosti [0.1; 0.3) nízký stupeň závislosti [0.30; 0.50) mírný stupeň závislosti [0.50; 0.70) význačný stupeň závislosti [0.70; 0.90) vysoký stupeň závislosti [0.90; 1) velmi vysoký stupeň závislosti 1 úplná pořadová (lineární) závislost 2