Ordinačné metódy 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita ♦ Mnohorozmerné metódy: názov „mnohorozmerné" - dáta sú tvorené objektami (vzorky, lokality), každý z nich je charakterizovaný viacerými parametrami (druhmi) každý z týchto parametrov môžme považovať za jeden rozmer objektu (vzorky) DATOVÁ MATICA CM CO ■u -o -o vzorka 1 vzorka 2 vzorka 3 vzorka 4 vzorka 5 vzorka 6 Hodnoty pre druhy (presencia/absencia; abundancia; dominancia) pre každú vzorku Ordinácia a zhluková analýza sú jediné možné techniky, ktoré môžeme použiť bez nameraných charakteristík prostredia. ♦ Klasifikuje vzorky (lokality), druhy alebo premenné ♦ Nachádza skupiny v dátach 0.7 -J o.e J 0.5 J O.3 J 0.2 -I O.l -J Ot-CNCO^- Í^CDIO O) O f- plants t animals 1 23 sites Direct gradient analySIS Sumarizing Indirect gradient analysis by ordination • • ordination diagram ♦ zoradí objekty pozdĺž environmentálneho gradientu ♦ cieľom ordinácie je sformulovať hypotézy o vzťahu medzi druhovým zložením spoločenstva na lokalitách a základnými environmentálnymi faktormi Ordinačné metódy = gradientova analýza 1 23 sites species data 1 23 sites ordination diagram ♦ Ordinačné metódy nepredpokladajú žiadne apriórne zoskupenie objektov. ♦ Ordinačné metódy patria medzi metódy, ktoré sa pužívajú hlavne k tvorbe hypotéz. Ordinačné metódy: terminológia Vysvetľované premenné (response) druhové dáta (species data) Vysvetľujúce premenné (explanatory) ♦ Primárne dáta: vzorky, objekty (samples, sites) Každá vzorka zahŕňa hodnoty pre viac druhov (species) alebo tzv. charakteristík prostredia (environmental variables, variables). Charakteristiky prostredia (environmental variables, variables) Kovariáty (covariates, covariables) ich vplyv chceme oddeliť Ordinačné metódy: typy dát Vysvetľované premenné /-------- sites 1 23..................... i..........n ^N 1 o 2 o o ■ Q. (/) k m species data _J Druhové dáta: akékoľvek premenné, ktorých hodnoty chceme predpovedať. Druhové zloženie spoločenstva je možné určovať presným kvantitatívnym spôsobom: ♦ počet jedincov jednotlivých druhov ♦ percentická pokryvnosť ♦ odhad biomasy prípadne podľa semikvantitatívnej stupnice ♦ Braun-Blanquetová stupnica alebo len kvalitatívnym spôsobom ♦ prítomnosť či neprítomnosť Ak by sme chceli napr. predpovedať obsah iónov kovu na základe skladby krajiny v povodí riek, v programe Canoco by boli koncentrácie jednotlivých iónov "druhy". Ordinačné metódy: typy dát Vysvetľujúce premenné, p red i kto ry o n .5 "Z > c o E c 2 > c 0) sites 1 23 Môžu byť použité k predpovedaniu hodnôt vysvetľovaných premenných (napr. predpovedanie zloženia rastlinného spoločenstva na základe znalosti pôdnych charakteristík a type obhospodarovávania). Charakteristiky prostredia, príp. kovariáty ♦ kvantitatívne premenné ♦ semikvantitatívne premenné ♦ faktoriálne (kategoriálne) premenné - prekódovanie do 0,1 ♦ faktoriálne (kategoriálne) - v Canoco prekódovať do tzv. indikátorových premenných (dummy variables) vzorka Geo vzorka žula čadič rula Vz1 žula Vz1 1 0 0 Vz2 žula ^\Vz2 1 0 0 Vz3 čadič / Vz3 0 1 0 Vz4 rula Vz4 0 0 1 Kovariáty (covariables, covariates): ak určitá vysvetľujúca premenná má vplyv na druhové dáta, ale pre nás je nezaujíma, môžem jej vplyv odpočítať => jej vplyv neinterpretujeme, chceme ho vziať do úvahy pri hodnotení vplyvu iných premenných Ordinačné metódy: typy dát Čo s chýbajúcimi dátami: Vzorky, v ktorých hodnoty chýbajú, môžeme vypustiť. Výhodné vtedy, ak sú chýbajúce dáta len v niekoľko málo vzorkách (case-wise deletion). Premenné, v ktorých hodnoty chýbajú, môžeme vypustiť, ak ich nieje veľa. Doplnenie chýbajúcich údajov: doplnenie priemeru zo vzoriek, kde sú hodnoty k dispozícii dopočítanie chýbajúcich hodnôt na základe mnohonásobného regresného modelu (takto ale prichádzame o stupne voľnosti) možnosť vzorkám s doplnenými hodnotami priradiť nižšiu váhu Ordinačné metódy: príklad využitia Ukážka užitočného použitia mnohorozmernej analýzy: Otázky: ♦ Môžeme na základe aktuálneho stavu krajiny predpovedať zánik hniezdiska ohrozeného vodného vtáka? ♦ Které zo zložiek krajiny sú pre túto predpoveď najdôležitejšie? Diagram naznačuje: ♦ 3 vtáčie druhy v krajine s vyšším percetom lúk svoju hniezdnu frekvenciu znižujú ♦ druh Gallinago gallinago ustúpil do krajiny, kde bolo malé percento mokradi ♦ otestovaním naznačených vzťahov nebola zistená štatistická významnosť žiadneho vzťahu Wetlands Decrease nfinn^n tetanus -Forest [ locrtA« vf-ViUlílIuí VancíllIS ' urease ol|. i nmsji I i innwi Meadows'" •Fields irVcrcrec nťtiaHmíitíu gallinago -0.9 +0.9 Ordinačný diagram znázorňuje prvé dve osi redundančnej analýzy (RDA) údajov o hniezdnych preferenciách vtákov. Typy štatistických modelov Nasledujúca tabuľka zhŕňa najdôležitejšie štatistické metódy používané v rôznych situáciách: Vysvetľovaná | premenná ... Prediktor(y) nemáme máme | ...je jedna ♦ zhrnutie distribučných vlastností ♦ regresný model s.l. ...je ich viac ♦ nepriama gradientova analýza (indirect gradient analysis - PCA, DCA, NMDS) ♦ zhluková analýza ♦ priama gradientova analýza ♦ obmedzená zhluková analýza ♦ diskriminačná analýza (discriminant analysis - CVA) Modely odpovede druhov na gradienty prostredia Dva typy modelu odpovede druhu na gradienty prostredia lineárny (linear) - najjednoduchší odhad (na krátkom gradiente dobre funguje lineárna aproximácia akejkoľvek funkcie) unimodálny (unimodal) - predpokladá, že druh má na gradientu prostredia svoje optimum (na dlhom gradiente je aproximácia lineárnou funkciou veľmi nevhodná) Environmental variable (e.g.,pH, elevation) Lineárna aproximácia unimodálnej odpovede na krátkom výseku gradientu Q) O C ns -o c -Q c E c o a. > C 0 1 23 Môžeme použiť oba prístupy: priamu aj nepriamu ordináciu. Spočítame najprv nepriamu ordináciu s následnou regresiou ordinačných osí na merané charakteristiky prostredia (tj. premietnutie týchto charakteristík do ordinačného diagramu) Spočítame priamu (obmedzenú) ordináciu. Tieto prístupy sú komplementárne a mali by sa použiť oba. Je potrebné vždy uviesť metódu, ktorá bola použitá. Hybridná gradientova analýza? Máme druhové dáta aj charakteristiky prostredia. 1 23 sites sites & O n .5 > c E c o a. > C 0 1 23 Hybridná analýza: „kríženec" medzi priamou a nepriamou ordináciou. V štandardnej priamej ordinácii je toľko obmedzených (kanonických) osí, koľko je nezávislých vysvetľujúcich premenných a len ďalšie ordinačné osi sú neobmedzené. V hybridnej analýze sa spočíta len vopred daný počet obmedzených osí a akékoľvek ďalšie ordinačné osi sú neobmedzené. Lineárny alebo unimodálny model? Voľba modelu: na základe dĺžky gradientu ♦ unimodálny model ak dĺžka najdlhšieho gradientu > 4 (techniky váženého priemerovania sú lepšie pre heterogénne dáta) ♦ lineárny model ak dĺžka najdlhšieho gradientu < 3 (nie je to však nutnosť použiť lineárny model) (techniky založené na modely lineárnej odpovede sú vhodné pre homogénne dátové súbory) Environmental variable (e.g.,pH, elevation) Ordinačné diagramy Výsledky ordinácií se obvykle prezentujú ako ordinačné diagramy. Lineárny model Unimodálny model vzorky ♦ znázornené bodmi (symbolmi) druhy ♦ šípky v smere rastu abundancií ♦ body (symboly) označujúce optimum druhu Charakteristiky prostredia kvantitatívne ♦ šípky v smere rastu hodnôt charakteristiky prostredia kvalitatívne ♦ centroidy pre jednotlivé kategórie Príklady ordinačných diagramov PCA RDA CA t-affP raji * ::i>- "; ,SucĽfcis»nal ig» -. í I 0 «V — -".ff^17R+ ■..... M. Statun J]' jK JTAJíLUf Slop« i ™ V -C 5 *a.í CCA o _*** Succtnlonil-Bflt i-» ■ k * ■O-g a Slip* Format súborov pre program Canoco 28. - 30. 5. 2007 MU IBA Inštitút biostatistiky a analýz, Masarykova univerzita Import súborov, program Canolmp ♦ Možnosť importu dát z tabuliek vytvorených v Exceli alebo z relačných databázy Program Canolmp nWCanolmp HOWTO USE THIS PROGRAM -- 1) In your spreadsheet: * Copy your data table to the Clipboard *any labels must be in Row 1 / Column 1 2) Confirm the options below and Save JsEI r'OPTIONG -P Each column is q Sample Generate labels for: T Samples (SampOOOl SampOOOE etc.) T Species / Env. Variables (VarOOOl Var0002 etc.) F Save in Condensed Format Save Exit Help ♦ V tabuľke usporiadať dáta do obdĺžnikovej matice (vzorky v riadkoch, premenné v stĺpcoch) ♦ Hlavičky riadkov a stĺpcov (možné, nie povinné) ♦ Mená {labels) musia byť dlhé nanajvýš 8 znakov; len písmená, medzery (ak je názov dlhší - program ho po 8 znaku odstrihne; zakázané znaky nahradí bodkou) ♦ Pole tabuľky - len čísla alebo prázdne polia (žiadne iné znaky) Import súborov, program Canolmp Program Canolmp IveWCanoImp JsE - HOWTO USE THIS PROGRAM 1) In your spreadsheet: * Copy your data table to the Clipboard "any labels must be in Row 1 / Column 1 2) Confirm the options below and Save i-'OPTIONG -I- Each column is a Sample Generate labels for: T Samples (SampOOOl Samp0002 etc.) T Species / Env. Variables (VarOOOl Var0002 etc.) F Save in Condensed Format Save Exit Help Skopírovať tabuľku v Exceli do pamäťe (Windows Clipboard) Spustiť program WCanolrnp Skontrolovať nastavenie WCanolrnp Ak máme maticu transponovánu (vzorky v stĺpcoch), zvoliť možnosť Each column is a Sample Ak nemáme mená vzoriek v prvom stĺpci, zvolíme Generate labels for: ... Samples Ak nemáme mená premenných v prvom riadku, zvolíme Generate labels for: ... Species Možnosť Save in Condensed Format riadi formát, ktorý sa pri tvorbe súboru použije Zvolíme Save: vyberieme meno súboru a uložíme WCanolrnp požaduje krátky popis dát; tento popis sa bude objavovať vo výstupoch z analýz. Ak popis nevložíme, je ponúkaný neutrálny text. Dátový súbor v programe Canoco Full format ® (D ® ® (D © (7) Popis súboru (max 80 znakov) Formát pre hodnoty dát Počet premenných v matici Dáta, začínajúc číslom vzorky Nulový riadok (ukončuje časť s dátami) Mená (labels) premenných na 8 znakov, 10 v jednom riadku Mená (labels) vzoriek na 8 znakov, 10 v jednom riadku © WCanolmp produced data file (2) (15,IX, 12F3.0) © 12 ® 1 1 1 0 1 0 1 0 0 0 0 0 2 1 0 0 1 0 0 1 0 0 0 0 3 0 1 0 1 0 0 0 1 0 0 0 48 1 1 0 0 1 0 0 0 0 0 0 ® 0 0 0 0 0 0 0 0 0 0 0 0 ® PhosphatBenlate Year! 34 Year 95 Year98 BOl B02 B03 B04 B05 B06 B07 ® PD01 PD02 PD03 PD04 PD05 PD06 PD07 PD08 PD09 PD10 PD11 PD12 PD13 PD14 PD15 PD16 C01 C02 C03 C04 . . . Dátový súbor v programe Canoco Kondenzovaný formát ® Popis súboru (max 80 znakov) (2) Formát pre hodnoty dát - formát riadku (3) Počet hodnôt v riadku (4) Dáta, začínajúc číslom vzorky (5) Nulový riadok (ukončuje časť s dátami) (6) Mená (labels) premenných na 8 znakov, 10 v jednom riadku (7) Mená (labels) vzoriek na 8 znakov, 10 v jednom riadku WCanolmp produced data file 5) (I5,1X,6(I6,F3.0)) 3) 6 1 23 1 25 10 36 3 41 4 53 5 57 3 1 89 70 100 1 102 1 115 2 121 1 2 11 1 26 1 38 5 42 20 50 1 55 30 2 62 2 69 1 70 5 74 1 77 1 86 7 79 131 15 (D o (fi) TanaVulgSeneAquaAvenPratLoliMultSalxPurpErioAnguStelPaluSphagnumCarxCaneSalxAuri (7) SangOffiCalaArunGlycFlui PRESEK ŠATLAV CERLK CERJIH CERTOP CERSEV ROZ13 ROZ24 ROZC5 ROZR10 Úprava dál v programe Canoco 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Transformácia druhových dát Logaritmická transformácia y'=\og(A*y + C) Čísla A a C volíme tak, aby bol výsledok vždy väčší alebo rovný 1. Default hodnoty A a C sú rovné 1 (nulové hodnoty mení na 0, ostatné sú kladné). Hodí sa výborne napr. na percentuálne dáta na stupnici 0-100. Transformácia na ordinálnu škálu Dáta o zložení rastlinného spoločenstva odhadované často na semikvantitatívnej Braun-Blanquetovej stupnici so siedmimi stupňami (r, +, 1, 2, 3, 4, 5). Takáto stupnica býva kvantifikovaná odpovedajúcimi poradovými hodnotami (od 1 do 7). Je možné nahradiť stupne stredom intervalu pokryvnosti: r 0.1 + 0.5 1 3 2 15 3 37.5 4 62.5 5 87.5 Transformácia druhových dát Odmocninová transformácia f — Táto transformácia môže byť vhodným riešením pre dáta y ~ V y vyjadrujúce počty (počet jedincov apod.). Na tieto dáta však môžeme použiť aj logaritmickú transformáciu. Iné transformácie Ak potrebujeme iný typ transformácie, ktorý Canoco neponúka, môžeme ju previesť v tabuľkovom procesore a transformované dáta do Canoca vyexportovat'. ♦ Je to užitočné, ak naše „druhové" dáta nepopisujú zloženie spoločenstva, ale niečo jako chemické či fyzikálne vlastnosti pôdy. Vtákom prípade mávajú premenné rôzne jednotky a pre každú z nich môže byť vhodná iná transformácia. Transformácia vysvetľujúcich premenných Transformácia vysvetľujúcich premenných ♦ U vysvetľujúcich premenných (charakteristík prostredia a kovariat) sa predpokladá, že nemajú jednotnú stupnicu a že pre každú z nich musíme voliť vhodnú transformáciu (vrátane častej voľby - netransformovať). ♦ Canoco ale taký postup neumožňuje, takže prípadnú transformáciu vysvetľujúcich premenných musíme previesť pred ich exportom do súboru v Canoco formáte. ♦ V každom prípade však Canoco potom, čo charakteristiky prostredia a / alebo kovariáty načíta, ich štandardizuje, čiže majú nulový priemer a jednotkový rozptyl. Nepriame ordinácie v Canocu 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Postup analýzy v programe Canoco Príprava dát napr. v Exceli i WCanolmp Canoco i CanoDraw ----------► Dve okná: Project view (zhŕňa najdôležitejšie charakteristiky projektu) Log view (záznamy o prevedených akciách a výsledky analýzy) „SOL" výsledky Nastavenie projektu pomocou sprievodcu: Options Po nadefinovaní projektu: Analyze Po zanalyzovaní grafický výstup: CanoDraw Voľba modelu - meranie dĺžky gradientu Aby sme mohli zvoliť medzi lineárnym a unimodálnym modelom, musíme odmeriať dĺžku gradientu. Spravíme skúšobný projekt - nastavíme detrendovanú korešpondenčnú analýzu (DCA), prípadne jej kanonickú formu (DCCA). Použijeme metódu odstránenia trendu po segmentoch (čo v sebe zahŕňa tiež Hillovo škálovanie ordinačných skóre) . Zvolíme aj ostatné nastavenia rovnaké ako v záverečných analýzach , Spustíme analýzu . V okne Log view prezrieme výsledky - na konci výpisu je súhrnná tabuľka (Summary table), v nej riadok začínajúci slovami „Lengths of gradient" Lengths of gradient : 2.990 1.324 .812 .681 unimodálny model ak dĺžka najdlhšieho gradientu > 4 lineárny model ak dĺžka najdlhšieho gradientu < 3 (nie je to však nutnosť použiť lineárny model) Analýza hlavných komponent (PCA) 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Analýza hlavných komponent (PCA) Nahrádza pôvodný súbor pozorovaných parametrov (druhová matica) súborom nových (hypotetických), vzájomne nekorelovaných premenných tak, že prvá nová os (prvá hlavná komponenta, PC1, prvý nový parameter) je vedená v smere najväčšej variability medzi objektami, druhá os (druhá hlavná komponenta, PC2, druhý nový parameter) je vedená v smere najväčšej variability, ktorý je kolmý na smer prvej komponenty, atď. 30 h 20 h 10 h PCA2 X2 p \ • PCA1 u Y-1 ^ # # \ * 1 \ . i \ ________1 _________i___________i____ __________1__________________L Je založená na vlastnej analýze (eigenanalysis) symetrických matíc (korelačnej, kovariančnej) 0 10 20 30 40 50 Analýza hlavných komponent (PCA) Cieľ PCA: určenie uhlov medzi pôvodnými a novými osami súradnicovej sústavy, súradnice objektov v novom systéme súradníc. Nové osy (komponenty) nie sú vzájomne korelované. A2 x2P x2] Á i \\l X2 p M\ X2P 9" ->• ^_ r~ "^ T- CM CO ^- lO 3 a». 3 a». 3 a». "O 3 a». 3 a_ "ô r vzorka 1 > o n o +j >o o Q_ vzorka 2 < \^ vzorka n Analýza hlavných komponent (PCA) Nastavenie škálovania :ňrjiliňť]- I niniu ktMknrfn Početnosti jednotlivých druhov sa môžu odrážať v dĺžke ich šípok (dominantné druhy budú mať potom šípky dlhšie než druhy vzácnejšie). (species scores: do not post-transform) Každý druh môže byť zrelativizovaný (divide by standard deviation -vhodné pre tzv. korelačné projekčné diagramy). Presnosť záveru o podobnosti druhov, vzťahov medzi druhmi a / alebo charakteristikami prostredia závisí z časti na škálach na jednotlivých ordinačných osiach. V prvom rade sa rozhodneme, či sa pri interpretácii zameriame na vzorky (porovnanie tried vzoriek, apod.) alebo druhy. Ak máme charakteristiky prostredia, prípadne kovariaty, species scaling umožňuje charakterizovať korelácie medzi charakteristikami prostredia. Analýza hlavných komponent (PCA) Pred vlastným počítaním ordinácie je nutné nastaviť možnosti manipulácie s tabuľkou druhových dát Centrovanie Priemer každého riadku bude rovný nule. Centering and Standardization ■■DJ^J SAMPLES SPECIES r- None (* Center by spečeš C Standardize bynorm H Center and stardardize r Standardize by error variance í* iNonej f-" Center by sample C Standardize by norm r Center and standardize < Back Next> Cancel Help Centrovanie druhov nutné pre lineárne metódy s obmedzením (RDA) alebo pre parciálnu lineárnu ordináciu (tj. pri použití kovariat) Analýza hlavných komponent (PCA) Štandardizácia í* iNonej r Center by sample f-" Standardize by norm r Center and standardize r- None <• Center by s^ec es ŕ* Standardize bynorm r Center and stardardize r Standardize by error variance < Back Next> Cancel Priemer každého stĺpca bude rovný nule. Štandardizácia (vzoriek alebo druhov) spôsobí, že norma každého riadku alebo stĺpca bude rovná jednej. Táto norma je odmocnina zo sumy štvorcov hodnôt v riadku alebo stĺpci. Ak použijeme centrovanie aj štandardizáciu, prevedie sa centrovanie ako prvé. Po vycentrovaní a štandardizácii budú v stĺpcoch premenné s nulovým priemerom a jednotkovým rozptylom. PCA na druhových dátach bude odpovedať „PCA na matici korelácií". Help ♦ ♦ ♦ ♦ Ak máme charakteristiky prostredia (v RDA a v PCA externe), môžeme zvoliť štandardizáciu chybovým rozptylom (error variance). Tu Canoco odhaduje pre každý druh zvlášť rozptyl v druhových dátach, ktorý zostane nevysvetlený po fitovaní závislosti hodnôt tohto druhu na vybraných charakteristikách prostredia (a kovariátach, ak ich máme). Prevrátená hodnota tohto rozptylu sa potom použije ako váha druhu. Čím lepšie bude druh popísaný charakteristikami prostredia, tým vyššiu bude mať váhu. Analýza hlavných komponent (PCA) Indirect gradient analysis Principal component analysis ♦ PCA je postavená na lineárnom modely; abundancia každého druhu buď narastá alebo klesá s hodnotou každého environmentálneho gradientu ♦ PCA je definovaná pre kovariančnú a pre korelačnú maticu ♦ PCA nie je vhodná pre dátovú maticu s veľa nulami REÁLNE DÁTA ► 6 lokalít, každá lokalita sledovaná 3 obdobia ► dátová matica: 18 vzoriek x 63 plankt. druhov hodnoty = stupeň dominancie 02 D3 ALOAFF DISROS LEYLEY MACI DIA0RG\ \|2 boscor\ iiAsor MACLAT DAPGAL felDCRY ZLOREČ B3 EURLAM G2 ALOQUA (BRATEST PLEDEN PLEADU ALOC .,----------T ALOW GHYDSPH „„lklir? K2SC^mcon'/cerqua/ CERMEG SIMC8^rret S3 ' S2 K3 aloexs| K1 DAPCUC G1 PAPLÓN MOIBRA DIABRA 11 Analýza hlavných koordinát (PCoA) 21. - 22. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Analýza hlavných koordinát v Canoco Principal coordinates analysis (PCoA, PCO): klasické, metrické škálovanie Vstupom je matica nepodobností alebo podobností medzi vzorkami, z ktorej sa počíta ordinácia. V ordinačnom diagrame sú vzorky rozmiestnené tak, že podobné vzorky sú blízko seba, kým vzorky nepodobné sú od seba vzdialené. Možnosť spočítať PCoA v Canoco: zvoliť analýzu hlavných komponent (PCA) ako druhové dáta je pripravená matica podobností alebo nepodobností (avšak s opačným znamienkom) - táto matica je teda štvorcová Centered by samples Centered by species Symetrické škálovanie ordinačných skóre; species score nie sú nijak transformované Korešpondenčná analýza (CA) a detrendovana korešpondenčná analýza (DCA) 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Korešpondenčná analýza ♦ Korešpondenčná analýza - nástroj pre analýzu vzťahov medzi riadkami a stĺpcami kontingenčných tabuliek ♦ Skúmanie vzťahov medzi dvoma premennými ♦ Kontingenčná tabuľka: frekvenčná tabuľka (dvojvstupná), ktorá zaznamenáva kumulativně početnosti dvoch nominálnych (kategoriálnych) premenných. Každý stĺpec a každý riadok tabuľky reprezentuje jednu kategóriu danej premennej. Kategórie druhej premennej H n m t m Kategórie prvej premennej Korešpondenčná analýza Korešpondenčná analýza všeobecne: ♦ Základnou myšlienkou metódy korešpondenčnej analýzy je vytvoriť či odvodiť indexy (pokiaľ možno „jednoduché"), ktoré budú nejakým spôsobom označovať (kvantifikovat') vzťahy medzi riadkovými a stĺpcovými kategóriami. Z týchto indexov potom budeme schopní odvodiť, ktorá stĺpcová kategória má väčšiu či menšiu váhu v danom riadku a naopak. ♦ Korešpondenčný analýza se tiež vzťahuje k otázke zníženia dimenzionality dát podobne ako napr. analýza hlavných komponentov (principal component analysis: PCA) a k snahe o dekompozíciu tabuľky na faktory. ♦ Grafické znázornenie vzťahov, ktoré obdržíme z korešpondenčnej analýzy, je založené na myšlienke reprezentovať všetky stĺpce a riadky a interpretovať relatívne pozície bodov ako váhy prislúchajúce danému stĺpcu a riadku. Systém indexov, ktorý si pomocou tejto metódy odvodíme, nám teda bude poskytovať súradnice každého stĺpca a riadku. Tieto súradnice zakreslíme do grafu, z ktorého môžeme poznať, ktoré stĺpcové kategórie sú viac dôležité v riadkových kategóriách a naopak. Korešpondenčná analýza Korešpondenčná analýza v synekológii: ♦ Najjednoduchšou cestou ako odhadnúť optimum druhu pre unimodálny model je spočítať vážený priemer tých hodnôt charakteristík prostredia, pri ktorých sa druh vyskytuje. ♦ Ako váha sa pri výpočte používa početnosť ci iná dôležitostná hodnota druhu. ♦ Pri váženom priemerovaní je implicitne zahrnutá štandardizácia po vzorkách aj po druhoch. Korešpondenčná analýza v ekológii spoločenstiev Korešpondenčná analýza: reciprocal averaging or eigenanalysis Sampl Samp2 Samp3 Cirsium Glechoma Rubus Urtica 0 0 3 I 5 2 1 6 2 0 8 1 oj initial value WA1 WA1 resc. WA2 WA2resc. WA3 WA3resc. WA4 WA4resc. 2 3.319 0.000 0.415 0.000 0.377 0.000 0.375 0.000 7 3.661 0.450 0.600 0.249 0.555 0.240 0.553 0.239 13 10.906 10.000 7.841 10.000 7.828 10.000 7.827 10.000 WA1 13.000 4.625 3.250 2.556 WA2 10.000 1.363 0.113 0.050 WA3 10.000 1.312 0.062 0.028 WA4 10.000 1.310 0.060 0.027 CA Náhodne zvolené Site Scores T Vypočítané Species Scores f* ako WA SS Štandardizácia Sp S Vypočítané nové Site Scores ako WASpS Štandardizácia S S Je zmena v scóre? NIEJ koniec ANO Korešpondenčná analýza v ekológii spoločenstiev Korešpondenčná analýza: reciprocal averaging or eigenanalysis Sampl Samp2 Samp3 WA4 Cirsium 0 0 ~TD 10.000 Glechoma 5 2 1 1.310 Rubus 6 2 0 0.060 Urtica 8 1 0 0.027 WA4resc. 0.000 0.239 10.000 odľahlá hodnota (outlier) Sampl2 Samplh U- ica t Urtica Glechoma Rubus Sampl3 H v Cirsium / Korešpondenčná analýza: výsledky ♦ Ordinačný diagram ♦ Skóre druhov a lokalít (riadkov a stĺpcov) ♦ Charakteristické vektory a charakteristické čísla matice (eigenvalues, eigenvector) /|\ Vysoké skóre: druh s nízkou Ci-J frekvenciou Charakteristické číslo (eigenvalue) odpovedá časti variability súboru vysvetlenej danou osou. locality Siteur Alaarv Car car Carchl Cor fru Pha col Gargla Eri rub Fricoe Pic Pic Par pal Par maj Coc coc Par caer Col pal Pyr pyr Syl atr Byl cur Cor ex Icerfam Corcrn Tro tro Pho ochr locality 1 Hirrus Str dec Pas mon Col liv Pas dom Tur pil Del rus Tur mer locality 3 Ser ser locality 4 Väčšinou používame prvé dva - tri charakteristické vektory = ordinačné osi. Ordinačné osi sú na sebe lineárne nezávislé. Korešpondenčná analýza (CA) Nastavenie škálovania Typ škálovania určuje, ako sa pozerať na druhové dáta pri diagrame druhy+vzorky. Biplot scaling je vhodnejší pre kratšie gradienty. Hillovo škálovanie zjednocuje šírky nik pre všetky osi. V prvom rade sa rozhodneme, či sa pri interpretácii zameriame na vzorky (porovnanie tried vzoriek, apod.) alebo druhy. Ak máme charakteristiky prostredia, prípadne kovariaty, species scaling umožňuje charakterizovať korelácie medzi charakteristikami prostredia. Korešpondenčná analýza (CA) Indirect gradient analysis Correspondence analysis ♦ CA je postavená na unimodálnom modely; každý druh sa vyskytuje v ohraničenom rozsahu hodnôt každého environmentálneho gradientu ♦ CA je odporúčaná pre druhové dáta, ktoré obsahujú mnoho nulových hodnôt REÁLNE DÁTA ► vtáčie druhy na 4 lokalitách ► dátová matica: 4 lokality x 38 dr. vtákov hodnoty = priemerná abundancia locality Siteur Alaarv Car car Carchl Cor fru Pha col Gargla Eri rub Fricoe Picpic Par pal Par maj Coc coc Par caer Col pal Pyr pyr Syl atr Byl cur Cor ex Icerfam Corcrn Tro tro Pho ochr locality 1 Hirrus Str dec Pas mon Col liv Pas dom Tur pil Del rus Tur mer locality 3 Ser ser locality 4 Korešpondenčná analýza: „arch effect" Indirect gradient analysis Correspondence analysis ♦ CA je postavená na unimodálnom modely ♦ pri silnej unimodálnej odozve sa v ordinačnom diagrame CA zvykne ukázať tzv. „arch effect" ♦ „arch effect" môžeme odstrániť použitím detrendovanej formy CA REÁLNE DÁTA ♦ suchozemské slimáky ► dátová matica: 42 lokalít x 33 dr. slimákov hodnoty = stupeň dominancie 2 3 25 39 75 Eal ^ 42Dro 31 28 33 07™ 20 2730 21 8 36 23pun Oelq Pru 3832 Tcy 1 Zni 12 AA CedCla 41 AniOum Spu l£m 354JP^Cpu „,. Efu 11 Cmi 6 Vpe Ffr ChoAar «/> Bbi 29 37 CluThi Sob A ~. Cvi 10 34 Sse ctr Tst 13 Ppy Ver ..- Vco 1522 J 26it1718 40 16 24 Ú Korešpondenčná analýza: „arch effect" „arch effect", „horse shoe effect" 2 3 25 39 75 Eal <*1 42Dro 31 28 33 o7oft 20 o/730 21 8 36 23 Pun Oel q Pru 3832 Tcy 1 Zni 12 AA Ced CLa 41 AniOum Spu ,Ä 35„QHP°Cpu .............____....._ j y.......müv......____ Efu 11 Cmi 6 Vpe Ffr ChoAar M Bbi 29 37 CluThi Sob A Cvi 10 34 Sse ctr Tst 13 Ppy Vcr ^ - Vco 1522 26 ,u1718 40 16 24 1 4 DCA Náhodne zvolené Site Scores T Vypočítané Species Scores ako WA SS Vypočítané nové Site Scores ako WASpS Detrendovanie Site Scores I Je zmena v skóre? koniec ANO Detrendovaná korešpondenčná analýza (DCA) Odstraňovanie trendu Detrending Method ■ Select method of detrending: <* lby segments! C by 2nd order polynomial HB odstraňovanie trendu po segmentoch ► neodporúča sa pre unimodálne ordinačné metódy, kde sú používané kovariáty alebo charakteristiky prostredia odstraňovanie trendu polynómami ► keď sú používané kovariáty alebo charakteristiky prostredia a je potrebné odstániť trend ► Pre unimodálne ordinácie s obmedzením (CCA) obvykle nie je detrendovanie nutné. Ak sa v CCA oblúkový efekt objaví, je to známkou nadbytočnosti v súboru zvolených charakteristík prostredia. ► Doporučuje sa vylúčiť silne korelované premenné. Výber charakteristík prostredia, které sú mezi sebou korelované len minimálne, sa dá previesť postupnou selekciou charakteristík prostredia (forward selection of environmental variables). Detrendovaná korešpondenčná analýza (DCA) Indirect gradient analysis Detrended correspondence analysis ♦ DCA je postavená na unimodálnom modely ♦ DCA odstraňuje „arch effect" niekoľkými možnými spôsobmi REÁLNE DÁTA ♦ suchozemské slimáky ► dátová matica: 42 lokalít x 33 druhov slimákov hodnoty = stupeň dominancie Eal Pru Zni _Sp!u Oel Ced Efu Cmi 12 6 Cvi w Ppy Vpe Vpu Sob 34 _. ctr264Qn35382331 11Í3^762928 304131 10 vcr242126193242 2736 Tst..14^ Uum3933 °° H po Ani 1 14 18VC015 91_ Cho Sse 2120 Pun Aar Thi Bbi Cpu 2& Cla Tcy Dro Priame ordinácie - ordinácie s obmedzením 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Priama gradientova analýza Grafické znázornenie jednoduchého lineárneho regresného modelu Y závislá premenná (vysvetľovaná) nezávislá X premenná (vysvetľujúca) regresný reziduál, označený ako e: rozdiel medzi (pozorovanými) hodnotami vysvetľovanej premennej Y a hodnotami predpovedanými modelom (očakávané hodnoty, Y so strieškou). i * j Y • • m _jŕT II [ Y = bb+ta|X+e| x Všetky štatistické modely majú dve dôležité zložky: systematická - časť variability vysvetľovaných premenných, ktorú môžeme vysvetliť vysvetľujúcimi premennými (prediktormi) pomocou zvolenej parametrickej funkcie. stochastická - ostávajúca časť variability hodnôt vysvetľovanej premennej, ktorú nemožno predpovedať systematickou časťou modelu. Definuje sa pomocou predpokladaných pravdepodobnostných a distribučných vlastností. Priama gradientova analýza Regresný model Kvalitu modelu posudzujeme podľa množstva variability popísanej systematickou zložkou (obvykle v pomere k stochastickej zložke). Regresný model s viacerými premennými Možnosť postupného výberu významných premenných Začíname s nulovým modelom bez prediktorov, predpokladáme, že variabilitu vysvetľovanej premennej nejde predpovedať, a popisuje ju len stochastická zložka. Potom vyberieme z dostupných premenných jediný prediktor- ten, ktorý v regresnom modely vysvetľuje najviac variability. Aj keď zvolíme ten najlepší prediktor, môže byť jeho príspevok len náhodný => testovanie (prehádzanie hodnôt tohto prediktoru ...) Postupné testovanie všetkých premenných; končíme keď „najlepší" z ostávajúcich kandidátov už nieje „dostatočne dobrý". Priama gradientova analýza Priama gradientova analýza (direct gradient analysis; constrained, canonical ordination methods) - kombinácia ordinácie a regresie Nepriame gradientově analýzy hľadali teoretické gradienty, ktoré boli „optimálnymi" prediktormi v regresných modeloch lineárnej či unimodálnej odpovedi druhov. Metódy priamej gradientovej analýzy sa snažia o to isté, ale gradienty, ktoré je týmto metódam „dovolené nájsť", sú viac obmedzené. Tieto gradienty sú lineárnou kombináciou predložených vysvetľujúcich premenných (charakteristík prostredia). Abundanciu jednotlivých druhov sa snažíme vysvetliť pomocou zložených premenných, ale tieto premenné sú definované na základe hodnôt pozorovaných charakteristík. Metódy priamej gradientovej analýzy sa podobajú mnohorozmernej násobnej regresu. V priamej gradientovej analýze: vplyv prediktorov na vysvetľované premenné cez niekoľko „zprostredkujúcich" gradientov - kanonických ordinačných osí (canonical axes, constrained axes). Existuje tu toľko kanonických osí, koľko je nezávislých vysvetľujúcich premenných. Výber štatisticky významných premenných Výber štatisticky významných premenných: permutacný test Permutation Type ? 1 x Permutation Type r Unrestricted permutations r Blocks defined by covariables ^j '•*" jRestricled for spatial or temporal structure or split-plot design! r Read from file: | r'jJ"'""""""'C"'-,J"' í* Set seeds Í23239 945 Randomize... Č Ley e rag e c o rrecte d re s i d u al s, d etau It see d s < Back Next> Cancel 1 Help Monte-Carlo permutacný test: testuje štatistickú významnosť obmedzených ordinačných modelov HO: primárne (druhové) dáta sú nezávislé na vysvetľujúcich premenných rôzne spôsoby nastavenia testu pre dáta s určitou priestorovou, časovou a logickou vnútornou štruktúrou, v závislosti na usporiadaní pokusu a odbere vzorky Výber štatisticky významných premenných Permutačný test permutované hodnoty premennej - vytvorenie niekoľkých permutácií (náhodné prehodenie hodnôt premennej medzi vzorkami) - testovanie rozdielu od pôvodnej premennej Priestorové a časové obmedzenia ak je v dátach vnútorná štruktúra použijeme pri permutáciách obmedzenie vzorky pozdĺž časového alebo lineárneho transektu => permutácie „rotováním" split-plot design permutácie v rámci bloku - ten je charakterizovaný niekoľkými nominálnymi premennými C Time series or line transects <• [Rectangular spatial gridj r Split-plot des gn F Disable randem shifts of mirror image < Back Next> Cancel Help Výber štatisticky významných premenných Permutačný test Ak použijeme manuálne permutačné testovanie - vidíme priebeh testovania po krokoch. Forward Selection Step The variables selected so far explain 0.320 of 0.447 5] E2Con [ 7] E1 Height [ 9] Rocks [6]E1 [ 3] Elope 0.025 0.020 0.020 0.016 0.016 The following variables were already selected: \ 11 Forest [ 3] BrLeaf [4]E2 (0.0050) (°.????) (0.0150) ? x Include variable Testva'iable Stop selection Hep Kandidáti na prediktory Vybrané charakteristiky prostredia Testovanie významnosti priamej ordinácie Permutačný test Testovanie významnosti prvej kanonickej ordinačnej osi: Monte-Carlo permutačný test Vhodný typ permutácií je určený typom experimentálneho designu a designu vzorkovania (možnosti permutacných testov pre split-plot designs a iné multi-level designs Global permutation test - Both above tests vykonajú sa dva Monte-Carlo testy: 1. test významnosti prvej kanonickej osi 2. test významnosti všetkých kanonických osí Testovať významnosť ordinačnej osi v nepriamych analýzach nie je možné. Testovať môžeme aj vplyv environmentálnych premenných po odčítaní kovariátov (parciálny test) Redundančná analýza (RDA) 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Redundačná analýza (RDA) 1 1 1 1Tť\ /"*t ^*l l*<^ ^1 1 ť\ ľ^ t <^ ľ^ <^ 11 tť> 1 /"^ ^^^-^^^-^^^-^^—^ 1 J /"^ ^J ■ ■ ľ^ ^J ^^ |^ /"\l # ^^ ľ^ ^^ 11 #/"N ■ /"N uireci graaieni analysis Keaunaancy analysis RDA nie je vhodná pre druhové dáta, v ktorých sa vyskytuje mnoho nulových hodnôt RDA je kanonická forma analýzy hlavných komponent (PCA) V obmedzenej metóde (RDA) podliehajú skóre objektov (vzoriek) obmedzujúcej podmienke: definujú sa ako lineárna kombinácia vysvetľujúcich premenných Redundačná analýza (RDA) Principal component analysis (PCA) PCA ... regresia Redundancy analysis (RDA) RDA ... mnohonásobná regresia Abundancia každého druhu je modelovaná lineárnou regresiou podľa vysvetľujúcej premennej, ktorej hodnoty sú neznáme (neznáme x; teoretický gradient, prvá hlavná komponenta). RDA obmedzuje hodnoty tak, že požaduje, aby x bolo lineárnou kombináciou meraných charakteristík prostredia. RDA je mnohonásobnou regresiou pre všetky druhy súčasne s lineárnym obmedzením regresných koeficientov. Supplementary species, samples, variables Tzv. suplementarne druhy, vzorky, charakteristiky prostredia (v staršej verzii Canoca označované ako pasívne) sa odlišujú od aktívnych tým, že neovplyvňujú tvorbu ordinačných osí. Môžu byť však pridané do existujúcej ordinácie (napr. regresným modelovaním ich dát na existujúce ordinačné osi). Druhy a vzorky, ktoré majú byť pasívne, musia byť pripravené v matici druhových dát. Charakteristiky prostredia, ktoré majú byť pasívne, musia byť pripravené v samostatnom súbore. Kanonická korešpondenčná analýzy (CCA) 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Kanonická korešpondenčná analýza (CCA) CCA je obmedzená ordinácia ♦ druhové dáta + vysvetľujúce premenné ♦ len „zmysluplné" vysvetľujúce premenné ♦ Forward selection: Permutačný test H0: Vysvetľovacia sila skupiny environmentálnych premenných sa pridaním danej premennej nezvýši viac, než keby sme pridali takú premennú, ktorá má rovnaké distribučné vlastnosti ako uvažovaná premenná, ale nemá žiadny vzťah k druhovým dátam. CCA Náhodne zvolené LC Scores T Vypočítané Species Scores ako WA z LC S T Vypočítané WA ako WA z SpS T Vytvorenie LC Site Scores predikciou z multiple regres. I Je zmena v skóre? NIEJ koniec ANO Kanonická korešpondenčná analýza (CCA) Direct gradient analysis Canonical correspondence analysis ♦ CCA je kanonická forma CA ♦ CCA sa odporúča pre druhové dáta s veľkým výskytom nulových hodnôt REÁLNE DÁTA ► spoločenstvá makrozoobentosu ► dátové matice: 60 lok. x 63 tax. (stupeň dominancie) 60 lok. x 13 environm. faktorov (fs) Harfus Eukcla Anc Parcon Gyralb Tvebav level Tubspd lsca PsabarChiplu Polped^^ijJJIrtp Brimodprooii NaididMicc^T lu Potant v(0.9) Hepsul Styher Dinjpun paeist fsypus / Cerann Cribic/Radova Simuli -HydpeJH^dcon. Setpun Limcla Limhof ,, , temperature. HydraC Concha cfúl Chired píqj Procho Styspďlbi la eo Limben Potmol icro Cerato Macneb Rheope Pisidi Cnann Ortwet Hydbul Fagaci Eřppct Thecfófk DrePo1 Caek HGlygri UnipicSphrÍ^akal , , Hexvrt Potlut Litnat Ephlin Unitum kpsamal Parciálne ordinácie 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Parciálna ordinácia Indirect gradient analysis Druhové dáta Kovariáty 1 23 sites sites 1 23 Direct gradient analysis Druhové dáta Kovariáty Charakteristiky prostredia 1 23 sites sites sites 1 23 to a> n .2 re > o u 1 23 environmental variables Parciálna ordinácia Parciálne ordinácie Pre všetky metódy je možné použiť dielčie (parciálne) analýzy. V parciálnych analýzach je najprv oddelený vplyv kovariát a analýza je potom prevedená len na zostávajúcej variabilite. Dátové zdroje: Principal component analysis (PCA) Correspondence analysis (CA) Dentrended correspondence analysis (DCA) > druhové dáta + kovariáty Redundancy analysis (RDA) Canonical correspondence analysis (CCA) druhové dáta + charakteristiky prostredia + kovariáty Diskriminačná analýza (CVA, DFA) 28. - 30. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Diskriminačná analýza Diskriminačná analýza ♦ sa snaží zjednodušiť viacrozmernú štruktúru dát výpočtom súhrnných osí (diskriminačnej funcie). ♦ Je jednou z metód ordinácie. ♦ Logika osí v diskriminačnej analýze je, že maximálne diskriminuje skupiny. vzorka 1 vzorka 2 vzorka 3 vzorka 4 vzorka 5 vzorka 6 (0 c Q. t- CM CO O O O +■» +J +J Q. Q. Q. 0) ■u (0 ■o (0 0 ■o ♦ Zaoberá sa závislosťou jednej kvalitatívnej premennej na niekoľkých kvantitatívnych premenných. ♦ Objekty charakterizované sériou deskriptorov (parametrov) - kvantitatívne parametre. Známa príslušnosť objektov do skupín. Diskriminačná analýza ♦ Analýza nachádza takú kombináciu vstupných parametrov, ktorá oddeľuje od seba skupiny objektov Skupina Vi y2 A 3 5 A 3 7 A 5 5 A 5 7 A 5 g A 7 7 A 7 9 B 6 2 B 6 4 B 8 2 B 8 4 B 8 6 B 10 4 B 10 6 Kvalitatívna premenná Kvantitatívne premenné (deskriptory) Diskriminačná analýza Pre počty skupín (g), znakov (p) a objektov (n) musí platiť: 1. Musia byť aspoň dve skupiny objektov: g > 2 2. V každej skupine musia byť najmenej 2 objekty 3. Počet znakov použitých v analýze musí byť menší než počet objektov znížený o počet skupín: 0 < p < (n-g) 4. Žiadny znak by nemal byť v niektorej skupine konštantný Počet skupín g > o n o +■" >o o Q_ (0 c 'Ö. 3 JU (ň r vzorka 1 vzorka 2 < \^ vzorka n Počet znakov p _J^ ŕ~ "^ T- CM CO ^B lO O Q. ĺ. O Q. a». O Q. a». O Q. ĺ. O Q. 0) 0) 0) -o 0) 0) -o Diskriminačná analýza ♦ Výsledkom diskriminačnej analýzy je diskriminačná funkcia (koeficienty deskriptorov). ♦ Premenné s najväčšími (štandardizovanými) koeficientami najviac prispievajú k predikcii príslušnosti do skupín. Skupina Raw Standardized coefficients coefficients Yl -0.6124 -1.0 y2 0.6124 1.0 konštanta 0.6124 vlastná hodnota 3.9375 3.9375 ♦ Počet diskriminačných funkcií je rovný počtu skupín znížený o jednu (prípadne počtu premenných, ak je tento nižší jako g-1) Diskriminačná analýza Vstup diskriminačnej analýzy: ♦ Tabuľka objektov charakterizovaných niekoľkými kvantitívnymi parametrami a jednou kvalitatívnou premennou (ktorá priraďuje objektom príslušnosť ku skupine) Výstup diskriminačnej analýzy: ♦ Ordinačný diagram (osami sú korene, čiže diskriminačné funkcie) ♦ Korene diskriminačnej analýzy (koeficienty diskriminačných funkcií) Pri použití diskriminačnej analýzy je potrebné pamätať na obmedzenia: ♦ parametrická metóda; vyžaduje normálne rozdelenie deskriptorov ♦ problém odľahlých hodnôt ♦ závislé na rozložení premenných ♦ výsledky udáva v pravdepodobnostiach ♦ nie je schopná zachytiť nelineárne vzťahy medzi prediktormi ♦ nedá sa použiť na silne korelované prediktory Diskriminačná analýza v Canoco Canonical Variates Analysis (CVA), discriminant analysis (DFA) Možnosť spočítať CVA v Canoco: zvoliť kanonickú korešpondenčnú analýzu (CCA) rozdelenie vzoriek do skupín vo forme druhových dát, ktoré sú binárne a charakterizujú príslušnosť vzorky ku skupine charakteristiky prostredia ako environmentálne dáta zvoliť Hillovo škálovanie so zameraním na inter-species distances V súbore .soľ species scores sú stredmi zhlukov v CVA ordinačnom diagrame sample scores, ktoré sú lineárnou kombináciou charakteristík prostredia sú škálované tak, že rozptyl v rámci skupín sa rovná 1 Permutačný test môže byť použitý na hodnotenie rozdielov medzi skupinami. Je možné špecifikovať aj kovariáty => parciálna CVA = one-way Multivariate Analysis of Covariance (MANOCO). Priame vs. nepriame ordinačné metódy 21. - 22. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Nepriama vs. priama gradientova analýza Indirect gradient analysis Druhové zloženie je ľahko determinovateľné a tak je lepším indikátorom prostredia ako akákoľvek kombinácia meraných environmentálnych premenných. Environmentálny gradient je možné charakterizovať len na základe druhových dát. * Direct gradient analysis Priama gradientova analýza poskytuje súhrn vzťahov druh-prostredie. Gradient je charakterizovaný pomocou env. premenných. Predpokladáme, že všetky druhy reagujú na zložený gradient env. premenných podľa rovnakého modelu odozvy. Environmentálne podmienky nieje možné vždy charakterizovať úplne - môže sa stať, že prehliadneme nejaký dôležitý faktor. Neparametrická ordinácia (NMDS) 21. - 22. 5. 2007 MU IBA 'nštitút bioštatistiky a analýz, Masarykova univerzita Neparametrická ordinácia (NMDS) Indirect gradient analysis Multidimensional scaling ♦ mnohonásobné škálovanie sa používa ako prieskumná metóda ♦ cieľom analýzy je zobraziť pozorované podobnosti alebo nepodobnosti (vzdialenostiach) medzi skúmanými objektami v euklidovskom priestore ♦ pomocou NMDS môžeme analyzovať nielen korelačné matice (ako v PCA) ale aj hocijakú inú maticu podobnosti/nepodobnosti * neparametrická ordinácia je robustnejšia k vychýleným hodnotám (napr. druh s výnimočne vysokou abundanciou na lokalite v jednom roku) dá sa použiť pred použitím nehierarchického zhlukovania K-means (v prípadoch keď nieje možné použiť euklidovské vzdialenosti) i—i počet dimenzií musí byť určený vopred ťažko interpretovateľné výsledky