Bi8660 Analýza dat na PC II

Přírodovědecká fakulta
jaro 2009
Rozsah
0/2/0. 2 kr. (plus ukončení). Ukončení: kz.
Vyučující
RNDr. Danka Haruštiaková, Ph.D. (cvičící)
RNDr. Eva Gelnarová (cvičící)
RNDr. Jan Mužík, Ph.D. (cvičící)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Jiří Jarkovský, Ph.D.
Rozvrh seminárních/paralelních skupin
Bi8660/01: Rozvrh nebyl do ISu vložen.
Bi8660/02: Rozvrh nebyl do ISu vložen.
Předpoklady
Základy práce s MS Windows, základy práce s MS Office, základy práce se Statistica for Windows, přehled o základních statistických metodách.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Kurz navazuje volně na výuku základů biostatistiky (Bi5040) a Analýzu dat na PC I (Bi7541). Cílem je v efektivní a blokové formě usnadnit orientaci posluchače v ovládání a realizaci pokročilých výpočtů v software STATISTICA for Windows, využití databází ve zpracování biologických dat a základy využití jazyka R jako alternativní cesty pro analýzu dat. Kurz je zaměřen pouze prakticky, výuka probíhá výhradně na PC. Jsou řešeny praktické úlohy na reálných datech z oblasti experimentální biologie, ekologie, medicíny. Kurz je tématicky flexibilní, lze provést i orientaci na data posluchačů nebo připravit nová témata dle návrhu.
Osnova
  • 1. Práce s daty v prostředí MS Access. Tabulky, dotazy a formuláře. Struktura databáze, datový model, vazby mezi tabulkami. Základy jazyka SQL. Import a export dat z MS Access, spolupráce se statistickými programy. 2. Úvod do R, základní statistické metody. Základy software R- historie, instalace, načtení dat, základní datové typy a struktury, tvorba funkcí, knihovny, formátování výstupů, operace s maticemi. Vizualizace dat – boxplot, histogram, scatter-plot. Operace s daty, transformace, přehled statistických rozdělení, korelační koeficienty. Statistické testy – testy normality, jednovýběrové a dvouvýběrové t-testy, neparametrické testy 3. Praktické cvičení ze základů stochastického modelování. Základy regresních technik; analýza rozptylu a korelační analýza v regresní analýze; polynomiální regrese; nelineární regrese; modely dávka-odpověď; logistická regrese. Práce s maticemi a vektory v procvičovaném software, vzorcová pole. Hodnocení závislosti/nezávislosti binárních a kategoriálních znaků. 4. Praktické cvičení ze základů vícerozměrných statistických metod. Práce s vícerozměrnými soubory; multidimensional scaling; normalizace, centralizace; hodnocení podobnosti a vzdálenosti objektů; shluková analýza; binární koeficienty podobnosti; korelační analýza a parciální korelace; faktorová analýza; korespondenční analýza; diskriminační analýza; vícerozměrná logistická regrese.
Literatura
  • Snedecor, G.W., Cochran, W.G.: Statistical methods, Iowa 1971, Iowa State University Press.
  • Zar, J.H.: Biostatistical analysis. New Jersey 1984, Prentice-Hall
  • Benedík, J., Dušek, L: Sbírka příkladů z biostatistiky. Nakladatelství Konvoj 1993, Brno.
  • Hebák, Petr - Hustopecký, Jiří. Vícerozměrné statistické metody s aplikacemi. Praha : SNTL - Nakladatelství technické literatury, 1987.
  • www.statsoft.com/textbook/stathome.html
  • www.r-project.org
Metody hodnocení
Hodnocení probíhá na základě účasti studenta na cvičeních.
Navazující předměty
Informace učitele
http://www.cba.muni.cz/vyuka/
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích jaro 2008 - akreditace, jaro 2003, jaro 2004, jaro 2005, jaro 2006, jaro 2007, jaro 2008, jaro 2010, jaro 2011.