Přechod na menu, Přechod na obsah, Přechod na patičku

2 Hodnotenie závislosti dvoch náhodných veličín

Hodnotením závislosti dvoch náhodných veličín sa zaoberá jednoduchá korelačná analýza, ktorá kladie dôraz viac na intenzitu vzájomného vzťahu než na skúmanie veličín v smere príčina – následok (regresia). Závislosti, ktoré skúma, sú predovšetkým lineárne, kde korelácia, z latinského correlátio [cor – spolu + relatio – vzťah], je mierou lineárneho vzťahu. Dôležitou skutočnosťou je, že korelácia nie je kauzalita. Veličiny, ktoré spolu korelujú, sú pravdepodobne navzájom závislé, ale nemožno z toho usúdiť, že by sa podmieňovali.

Úlohou korelačnej analýzy je koreláciu identifikovať, kvantifikovať a štatisticky otestovať. Nevyhnutnou súčasťou je logický rozbor problému, a to z hľadiska významu samotnej korelácie, ktorá môže byť skreslená alebo nemusí vôbec existovať. Pri použití dvojrozmerných metód sa často vyskytuje falošná korelácia, čo je neexistujúca korelácia medzi premennými $X$ a $Y$, ktorá sa dôsledkom iných (nezohľadnených) premenných zdá ako silná. Hodnotu korelácie posúva taktiež nedostatok homogenity vo vzorke a formálny vzťah medzi veličinami (korelácia percentuálnych charakteristík, ktoré sa doplňujú do 100 %).

V tejto kapitole sa zoznámime s rôznymi koeficientami, na základe ktorých budeme posudzovať existenciu a silu závislostí. Hlavnými literárnymi zdrojmi sú [4], [3], [5].

2.1 Kovariancia

Lineárny vzťah môže byť priamy, tj. s rastúcimi (resp. klesajúcimi) hodnotami jednej veličiny rastú (resp. klesajú) hodnoty druhej veličiny a naopak; alebo nepriamy, tj. s rastúcimi hodnotami jednej veličiny klesajú hodnoty druhej a naopak.

O tom, či sú dve náhodné veličiny $X$ a $Y$ vo vzájomnom lineárnom vzťahu (priamom, nepriamom), sa môžeme presvedčiť na základe kovariancie $C(X,Y)$ definovanej ako stredná hodnota súčinu centrovaných náhodných veličín:

\begin{equation} C(X,Y)= E([X-E(X)][Y-E(Y)]) = E(XY)-E(X)E(Y)\text{.}\tag{2.1} \end{equation}

Z hodnoty kovariancie sme schopní určiť smer lineárneho vzťahu, ale nie jeho silu. Dôvodom je, že kovariancia závisí od jednotiek, v ktorých sú náhodné veličiny merané a nadobúda preto hodnoty z intervalu $(-\infty,\infty)$.

Dané závislosti môžeme orientačne posúdiť z bodového grafu, v ktorom je každá dvojica hodnôt znázornená jedným bodom v rovine. V nasledujúcich troch obrázkoch znázorníme korelačný vzťah medzi veličinami odpovedajúci hodnote kovariancie.

Kladná kovariancia
Obrázok 2.1: Kladná kovariancia
Záporná kovariancia
Obrázok 2.2: Záporná kovariancia

Z obrázkov obr 2.1obr 2.2 je zrejmé, že sa jedná o priamy, resp. nepriamy lineárny vzťah, kedže sa dané hodnoty menia rovnakým, resp. opačným smerom, pričom priebeh tejto závislosti je možné schematicky popísať priamkou. Obrázok obr 2.3 zachytáva dve odlišné situácie, pritom obe odrážajú takmer nulovú hodnotu kovariancie. Je to prostým dôsledkom toho, že kovariancia hovorí o existencii lineárneho vzťahu, ktorý sa ani v jednom z grafov nevyskytuje. Preto nulovosť kovariancie nemusí hovoriť nič o obecnom vzťahu pozorovaných veličín, ktorý môže byť aj nelineárny.

Kladná kovariancia
(a) lineárna nezávislosť
Záporná kovariancia
(b) nelineárna závislosť
Obrázok 2.3: Takmer nulová kovariancia

2.2 Korelačné koeficienty

Zhrnutím vlastností kovariancie z predchádzajúcej časti dospievame k záveru, že kovariancia nie je najvhodnejšou mierou závislosti. Používa sa väčšinou ako pomocný nástroj pri meraní intenzity lineárneho vzťahu.

Najpoužívanejšou charakteristikou intenzity lineárneho vzťahu medzi dvoma náhodnými veličinami je korelačný koeficient. Existuje rada korelačných koeficientov, ktoré aplikujeme v závislosti od typu náhodných veličín. V našom prípade sa obmedzíme na dva korelačné koeficienty O iných korelačných koeficientoch sa môžeme dočítať v literatúre [11], [2]., konkrétne Pearsonov a Spearmanov korelačný koeficient, určujúce závislosti intervalových, pomerových alebo ordinálnych veličín.

2.2.1 Pearsonov koeficient korelácie

Kovariancia náhodných veličín $X$ a $Y$ bola definovaná ako stredná hodnota súčinu centrovaných veličín $X$ a $Y$.

Pearsonov koeficient korelácie definujeme ako strednú hodnotu súčinu štandardizovaných náhodných veličín:

\begin{equation} R(X,Y)=E\Biggl(\frac{X-E(X)}{\sqrt{Var(X)}} \cdot \frac{Y-E(Y)}{\sqrt{Var(Y)}}\Biggr)=\frac{C(X,Y)}{\sqrt{Var(X)} \cdot \sqrt{Var(Y)}}\tag{2.2} \end{equation} pre $\sqrt{Var(X)}$, $\sqrt{Var(Y)} >0$, inak $0$.

Štandardizáciou náhodných veličín sme takto získali novú bezrozmernú mieru lineárnej závislosti, ktorá nadobúda hodnoty z intervalu $\langle -1 ; 1\rangle$. Znamienko korelačného koeficienta závisí od kovariancie, podľa ktorej hodnotu koeficienta interpretujeme:

Pre zjednodušenie budeme koeficient $R (X,Y)$ označovať ako $R$. Čím viac sa $\vert R \vert$ blíži k $1$, tým je lineárna závislosť silnejšia a naopak, čím viac sa $\vert R \vert$ blíži k $0$, tým je lineárna závislosť slabšia. Svoje extrémné hodnoty (tj. $-1, 1$) nadobúda vtedy, keď platí $P(Y=a+bX)=1$, pre $ a,b \in \mathbb{R}$ ($b\ne 0$) a všetky realizácie veličín $X$, $Y$ ležia na priamke. V takomto prípade ide o funkčnú priamu ($b>0$), popr. nepriamu ($b\lt 0$) lineárnu závislosť.

Vzhľadom k možnosti existencie nelineárneho vzťahu medzi $X$ a $Y$ nie je možné pri nulovom koeficiente $R$ (tj. $C(X,Y)=0$) označiť veličiny $X$ a $Y$ za nezávislé. Nulová hodnota koeficienta je nutnou podmienkou nezávislosti, nie však podmienkou postačujúcou. Nekorelovanosť odpovedá nezávislosti v prípade, že veličiny $X$ a $Y$ pochádzajú z dvojrozmerného normálneho rozdelenia (dôkaz viď nasledujúca kapitola, sekcia normalita).

Predstavu o význame hodnôt koeficienta korelácie získame rovnako ako pri kovariancii: z bodových grafov. Podľa charakteru rozloženia bodov v grafe môžeme odhadnúť, aká silná, resp. žiadna závislosť medzi veličinami existuje.

Kedže koeficient korelácie meria silu lineárneho vzťahu, potom tesnosť bodov okolo pomyselnej priamky indikuje jeho veľkosť, pričom znamienko je oplyvnené smerom tejto závislosti. Ak sa vrátime k obrázkom z prechádzajúcej sekcie, silnejšiu závislosť zachytávajú obrázky obr 2.1, obr 2.2, kde ležia body blízko pomyselnej priamky, o čom svedčia aj konkrétne hodnoty korelačného koeficienta $0,81$ a $-0,85$. Z obrázku obr 2.3 by sme očakávali nulovú hodnotu korelačného koeficienta, v oboch prípadoch, kedže na obrázku obr 2.3a, sú body rozptýlené do „kruhu“ a na obr 2.3b je zjavná nelineárna závislosť. Hodnoty korelačných koeficientov sú $-0,06$ a $0,12$. Prakticky tieto výsledky zodpovedajú nášmu očakávaniu, koeficient vzťahujúci k obrázku obr 2.3a je takmer nulový a o niečo vyššia hodnota koeficienta vzťahujúceho k obrázku obr 2.3b je spôsobená jeho použitím na veličiny závisle nelineárne.

Výberové charakteristiky

Výpočet korelačného koeficienta je podmienený znalosťou konkrétneho simultánneho rozdelenia náhodného vektora $(X,Y)^{'}$, čo sa prakticky stáva veľmi zriedka. V praxi sa preto odkazujeme na náhodný výberDvojrozmerným náhodným výberom rozsahu $n$ sa rozumie postupnosť $n$ nezávislých, rovnako rozdelených náhodných vektorov. Presnú definíciu viď [4], str. 52 $(\mathbb{X}, \mathbb{Y})=((X_1,Y_1)^{'},\ldots,(X_n,Y_n)^{'})$ rozsahu $n$ z dvojrozmerného rozdelenia s distribučnou funkciou $F(x,y)$, kedy môžeme charakteristiky náhodných veličín odhadnúť pomocou výberových charakteristík (štatistík). Výberové charakteristiky sú funkcie daného náhodného výberu, ktoré nezávisia od neznámeho parametra rozdelenia, ktorým sa náhodný výber riadi.

Definujme nasledovné štatistiky:

  1. výberový priemer\[ M=\frac{1}{n}\sum_{i=1}^n X_i \text{,}\]
  2. výberový rozptyl\[S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i -M)^2=\frac{1}{n-1}\left(\sum_{i=1}^{n} X_i^2 - nM^2\right) \text{,}\]
    1. výberová smerodajná odchýlka\[S=\sqrt{S^2} \text{,}\]
  3. výberová kovariancia\[S_{12}=\frac{1}{n-1}\sum_{i=1}^n(X_i-M_1)(Y_i-M_2)=\frac{1}{n-1}\left( \sum_{i=1}^n X_iY_i-nM_1M_2\right) \text{,}\] kde $M_1=\frac{1}{n}\sum_{i=1}^nX_i$ a $M_2=\frac{1}{n}\sum_{i=1}^nY_i$.

Výberový korelačný koeficient je potom definovaný ako pomer výberovej kovariancie k súčinu výberových smerodajných odchýliek veličín $X$, $Y$:

\begin{equation} R_{12}=\frac{S_{12}}{S_1S_2}=\frac{1}{n-1}\sum_{i=1}^n \frac{X_i-M_1}{S_1}\cdot \frac{Y_i-M_2}{S_2} \text{,}\tag{2.3} \end{equation} pre $S_1S_2 \ne 0$.
Funkčná závislosť
Obrázok 2.4: Ilustrácia vychýlenosti

2.2.2 Spearmanov koeficient korelácie

Na určenie závislosti medzi dvoma náhodnými veličinami $X$, $Y$ sa používa často tzv. poradová korelácia. Spočíva v nahradení realizácií náhodných veličín poradovými číslami, tj. pôvodné hodnoty $x_i$ a $y_i$, pre $i=1,2,\ldots,n$, nahradzujeme ich poradovými číslami $R_i$ a $Q_i$. Pokiaľ sa nejaká pôvodná hodnota opakuje viackrát Príliš veľký výskyt rovnakých hodnôt spôsobuje skreslenie Spearmanovho koeficienta, a preto je vhodné použiť korigovaný Spearmanov koeficient definovaný v [11], str. 396., priradíme každej takejto hodnote rovnaké poradové číslo určené ako aritmetický priemer poradových čísel, ktoré by tieto hodnoty mali, keby boli rôzne a nasledovali za sebou.

Ide o neparametrickú metódu popisujúcu monotónnu závislosť, nielen lineárnu, ale obecne rastúcu alebo klesajúcu. Neparametrickou charakteristikou závislosti náhodných veličín $X$, $Y$ je SpearmanovSpearmanov koeficient poradovej korelácie je odhad jeho teoretickej hodnoty $R_s$. koeficient poradovej korelácie daný vzťahom

\begin{equation} r_s= 1-\frac{6}{n(n^2 -1)}\sum_{i=1}^n(R_i-Q_i)^2 \text{.}\tag{2.4} \end{equation}

Spearmanov koeficient poradovej korelácie je totožný s výberovým koeficientom korelácie aplikovaným na poradie zložiek náhodného výberu; dôkaz viď [2], str. 560. Nadobúda obdobne hodnoty z intervalu $\langle -1 ; 1\rangle$. Hodnoty blízke $0$ ukazujú na slabšiu poradovú závislosť premenných, hodnoty blízke $1$ či $-1$ na tesnejšiu poradovú závislosť (priamu, nepriamu). Rovnosť $r_s=1$ platí, ak $R_i-Q_i=0$, tj. pri zhodných poradiach a naopak, rovnosť $r_s=-1$ je splnená, ak sú poradia presne opačné. Potom realizácia daného náhodného výberu $(x_i,y_i)$, $i=1,2,\ldots,n$, leží na nejakej monotónnej krivke, ako môžeme vidieť na obrázku obr. 2.5f.

graf
(a) $r=0,82$, $r_s=0,82$
graf
(b) $r=0,82$, $r_s=0,69$
graf
(c) $r=0,82$, $r_s=0,99$
graf
(d) $r=0,82$, $r_s=0,5$
graf
(e) $r=0$, $r_S=0$
graf
(f) $r=-0,82$, $r_s=-1$
Obrázok 2.5: Rôzne bodové konfigurácie a k nim dopočítané hodnoty Pearsonovho výberového ($r$) a Spearmanovho ($r_s$) korelačného koeficienta

Obrázok obr. 2.5 zobrazuje rôzne bodové konfigurácie na uľahčenie interpretácie hodnôt Spearmanovho a tiež Pearsonovho výberového koeficienta korelácie, pričom kladie dôraz na porovnanie toho, ako sa oba koeficienty chovajú v závislosti od druhu a sily daných vzťahov medzi veličinami. Ak ide o nelineárnu monotónnu závislosť, koeficient $\vert r_s \vert$ je väčší než koeficient $\vert r\vert$. Graficky a číselne na obr. 2.5f. To, že je Spearmanov koeficient založený na poradových číslach náhodných veličín, umožňuje jeho rezistentnosť voči odľahlým hodnotám, na rozdiel od Pearsonovho koeficienta, ktorý je na odľahlé hodnoty citlivý, viď obrázok obr. 2.5c. Závislosť zobrazená na obrázku obr. 2.5e je závislosť kvadratická, na ktorú ani jeden z koeficientov nemá dosah.

Meranie závislosti dvoch poradí je vlastne špeciálnym prípadom merania lineárnej závislosti dvoch náhodných veličín, čo sa odráža aj v tom, že Spearmanov koeficient je rovný Pearsonovmu výberovému koeficientu veličín $X$ a $Y$, kedy obe nadobúdajú hodnoty $1,2,\ldots,n$. Tento prípad ilustruje obrázok obr 2.6.

Zhodné korelačné koeficinety (r=r_s=0,97)
Obrázok 2.6: Zhodné korelačné koeficinety ($r=r_s=0,97$)

Z vlastností Spearmanovho koeficienta vyplýva, že sa používa v situáciách, kedy skúmané náhodné veličiny majú ordinálny charakter a nepredpokladáme medzi nimi čisto lineárny vzťah ani typ rozdelenia.