Bi8600 Vícerozměrné statistické metody

Přírodovědecká fakulta
podzim 2012
Rozsah
2/1/0. 3 kr. (příf plus uk plus > 4). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
prof. RNDr. Ladislav Dušek, Ph.D. (přednášející)
RNDr. Jiří Jarkovský, Ph.D. (přednášející)
RNDr. Simona Littnerová, Ph.D. (cvičící)
RNDr. Danka Haruštiaková, Ph.D. (přednášející)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: prof. RNDr. Ladislav Dušek, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Rozvrh
Út 15:00–17:50 F01B1/709
Předpoklady
Bi5040 Biostatistika - základní kurz Znalost základních statistických technik jednorozměrné analýzy dat, analýza rozptylu, korelační analýza, jednoduchá regresní analýza přímky
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
V závěru kurzu je student schopen: Korektně připravit datový soubor pro vícerozměrnou analýzu; Vybrat vhodnou metriku podobnosti nebo vzdálenosti včetně metrik používaných pro biologická společenstva; Ovládá aplikaci a principy různých shlukovacích algoritmů; Ovládá aplikaci a principy různých ordinačních metod; Ovládá aplikaci a princip lineární diskriminační analýzy; Zná výhody a omezení jednotlivých dostupných metod; Interpretovat výsledky vícerozměrné analýzy dat; Získá přehled o dostupných software pro vícerozměrnou analýzu dat.
Osnova
  • 1. Vícerozměná analýza dat – smysl a cíle. Příklady užití vícerozměrných analýz. Výhody a nevýhody vícerozměrné analýzy dat. Parametrická a neparametrická vícerozměrná statistika. Statistické SW pro vícerozměrnou analýzu dat. 2. Vícerozměrné statistické testy a rozložení. Vícerozměrné normální rozložení. Vícerozměrné charakteristiky – medoid. Hottelingovo T, Wishartovo rozdělení. 3. Základní matematické operace s vektory a maticemi. Charakteristická čísla a vektory matic. Numerické zpracování vícerozměrných ekologických dat. Základní grafické metody zviditelnění vícerozměrných souborů dat. 4. Transformace a jiné úpravy vícerozměrných dat. Korelační struktura vícerozměrných dat. Podobnost a vzdálenost objektů ve vícerozměrném prostoru. Metriky podobnosti a vzdálenosti a jejich úskalí. Asociační matice. 5. Shluková analýza. Kriteria posuzování výsledků shlukovacích metod. Základní algoritmy a volba optimální metody porovnávání vzdáleností objektů. Praktické příklady, aplikace v ekologii, medicíně, sociálních vědách. Srovnání centroidů dvou nebo více vícerozměrných souborů. Koeficienty podobnosti a shluková analýza. Hierarchické aglomerativní shlukování. Shlukovací algoritmy. Hierarchické divizivní shlukování. Nehierarchické divizivní shlukování. 6. Diskriminační analýza spojitých a diskrétních dat. Bayesovský a Fisherův přístup k diskriminační analýze. Ukázka prací, experimentální přístupy k diskriminační analýze. Logistická regrese jako alternativa diskriminační analýzy. 7. Základní přehled a interpretace ordinačních metod. Principy ordinačních analýz - redukce dimenzionality. Vícerozměrné soubory nominálních dat a absolutních četností. Základní typy ordinační analýzy a jejich užití. Analýza hlavních komponent (PCA). Faktorová analýza (FA). Korespondenční analýza (CA). Detrendovaná korespondenční analýza (DCA). 8. Kanonické ordinační metody. Kanonická korespondenční analýza (CCA). Detrendovaná kanonická korespondenční analýza (DCCA). Redundanční analýza (RDA). Další ordinační metody: Mnohonásobné škálování (MDS), Analýza hlavních koordinát (PcoA), Kanonická korelace. 9. Vícerozměrná analýza experimentálních dat: vícerozměrná analýza rozptylu (MANOVA). Hodnocení vícerozměrných vzorkovacích plánů 6. Úvod do vícerozměrných klasifikací (klasifikace na základě vícerozměrné podobnosti, klasifikační a regresní stromy, základ neuronových sítí) 10. Aplikace vícerozměrných metod v hodnocení druhové diverzity ve vícerozměrné analýze. Možnosti vícerozměrného numerického zpracování odhadů druhové diverzity 11. Ucelený souhrn aplikace vícerozměrných metod v ekologii, environmentální chemii, experimentální biologii a klinických vědách. Praktické ukázky návaznosti shlukové analýzy a analýzy hlavních komponent. Strukturní analýza a volba optimálního postupu při zpracování dat.
Literatura
  • Legendre, P., Legendre, L. (1998) Numerical ecology. Elsevier, 2nd ed.
  • ter Braak, C.J.F. (1996). Unimodal models to relace species to environment. DLO-Agricultural Mathematics Group, Wageningen
  • Zar, J.H. (1998) Biostatistical analysis. Prentice Hall, London. 4th ed.
  • Flury, B., Riedwyl, H. (1988) Multivariate statistics. A practical approach. Chapman and Hall, London
Výukové metody
Teoretické přednášky doplněné komentovanými příklady, studenti jsou podporováni v kladení otázek týkajících se probírané látky.
Metody hodnocení
Předmět je ukončen písemnou zkouškou zaměřenou zejména principy vícerozměrných metod, předpoklady výpočtů a jejich aplikaci.
Informace učitele
http://www.cba.muni.cz/vyuka/
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2007 - akreditace, podzim 2010 - akreditace, jaro 2003, jaro 2004, jaro 2005, jaro 2006, jaro 2007, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2011 - akreditace, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2019, podzim 2020, podzim 2021.