Bi7541 Analýza dat na PC I

Přírodovědecká fakulta
podzim 2007
Rozsah
0/2/0. 2 kr. (plus ukončení). Ukončení: kz.
Vyučující
RNDr. Jiří Jarkovský, Ph.D. (cvičící)
RNDr. Danka Haruštiaková, Ph.D. (cvičící)
RNDr. Eva Gelnarová (cvičící)
RNDr. Jan Mužík, Ph.D. (cvičící)
prof. RNDr. Ladislav Dušek, Ph.D. (cvičící)
Mgr. Adam Svobodník, Ph.D. (cvičící)
Garance
RNDr. Jiří Jarkovský, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Jiří Jarkovský, Ph.D.
Předpoklady
Základy práce s MS Windows, základy práce s MS Office, přehled o základních statistických metodách.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Kurz navazuje volně na výuku základů biostatistiky (Bi5040). Cílem je v efektivní a blokové formě usnadnit orientaci posluchače v ovládání a realizaci výpočtů v software STATISTICA for Windows (v5.5; v6.0). Kurz je zaměřen pouze prakticky, výuka probíhá výhradně na PC. Jsou řešeny praktické úlohy na reálných datech z oblasti experimentální biologie, ekologie, medicíny. Kurz je tématicky flexibilní, lze provést i orientaci na data posluchačů nebo připravit nová témata dle návrhu.
Osnova
  • A) Základy ovládání software Statistica for Windows a práce s daty Seznámení s programem; instalace programu Statistica (systémové požadavky, instalace); organizace nabídek a logika práce s programem; Statistica 5.5 a 6 - rozdíly ve struktuře a organizaci programu, přehled jednotlivých menu, nastavení programu, práce s nápovědou, internetové stánky; Práce s daty; import dat (načtení dat z MS Excel, textových a databázových souborů, struktura souborů); Operace s daty (typy proměnných, úpravy záznamů a proměnných, odvozené a vypočítané proměnné - transformace, transponování, chybějící hodnoty); výstup výsledků; typy výstupů (pracovní sešity Statistiky 6 a jejich možnosti, výstupy ve Statistice 5.5); export grafů a tabulek (výstupní formáty grafů, výstupní formáty tabulek); spolupráce s programy MS Office (vkládání tabulek a grafů do dokumentů Office, jejich úpravy)
  • B) Deskriptivní analýza, modul "Basic statistics" programu Statistica Popisná statistika; popisné parametry proměnných (průměr, směrodatná odchylka, standardní chyba, medián, kvantity, rozsah hodnot, šikmost, špičatost); popisné grafy a tabulky (histogram, box and whisker plot, frekvenční tabulky); normalita dat (Kolgomorov-Smirnovův test normality, Shapiro-Wilk`s test) Grafy; základní typy grafů (scatter plot, histogram, box and whisker plot, sloupcové, koláčové a čárové grafy); matice grafů a speciální typy grafů (matrix plots, categorized plots, 3D grafy); korelace parametrická (Pearsonův korelační koeficient, partial correlation); korelace neparametrická (Spearman, Kendal Tau, Gamma)
  • C) Testování a analýza dat Parametrické testy; one sample t-test (předpoklady, využití); two sample t-test (two sample t-test s závislými a nezávislými proměnnými, předpoklady, využití); F-test (porovnání rozptylů); Neparametrické testy; srovnání dvou nezávislých vzorků (Man-Whitney U test, Kolgomorov-Smirnovův test); srovnání dvou závislých vzorků (Wilcoxonův test, znaménkový test); srovnání více nezávislých vzorků (Kruskal-Wallis ANOVA, mediánový test); one way ANOVA (předpoklady, využití)
  • D) Praktické cvičení ze základů stochastického modelování Základy regresních technik; analýza rozptylu a korelační analýza v regresní analýze; polynomiální regrese; nelineární regrese; modely dávka-odpověď; logistická regrese. Práce s maticemi a vektory v procvičovaném software, vzorcová pole. Hodnocení závislosti/nezávislosti binárních a kategoriálních znaků.
  • E) Praktické cvičení ze základů vícerozměrných statistických metod Práce s vícerozměrnými soubory; multidimensional scaling; normalizace, centralizace; hodnocení podobnosti a vzdálenosti objektů; shluková analýza; binární koeficienty podobnosti; korelační analýza a parciální korelace; faktorová analýza; korespondenční analýza; diskriminační analýza; vícerozměrná logistická regrese.
Literatura
  • Snedecor, G.W., Cochran, W.G.: Statistical methods, Iowa 1971, Iowa State University Press.
  • Zar, J.H.: Biostatistical analysis. New Jersey 1984, Prentice-Hall
  • Benedík, J., Dušek, L: Sbírka příkladů z biostatistiky. Nakladatelství Konvoj 1993, Brno.
  • HEBÁK, Petr a Jiří HUSTOPECKÝ. Vícerozměrné statistické metody s aplikacemi. Praha: SNTL - Nakladatelství technické literatury, 1987. info
Navazující předměty
Informace učitele
http://www.cba.muni.cz/vyuka/
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Poznámka k četnosti výuky: možno i blokově.
Předmět je zařazen také v obdobích podzim 2007 - akreditace, jaro 2011 - akreditace, podzim 2010 - akreditace, podzim 2002, podzim 2003, podzim 2004, podzim 2005, podzim 2006, podzim 2008, podzim 2009, podzim 2010, jaro 2011, podzim 2011, jaro 2012, podzim 2011 - akreditace, jaro 2012 - akreditace, podzim 2012, jaro 2013, podzim 2013, jaro 2014, podzim 2014, jaro 2015, podzim 2015, jaro 2016, podzim 2016, jaro 2017, podzim 2017, jaro 2018, podzim 2018, jaro 2019, podzim 2019, jaro 2020, podzim 2020, jaro 2021, podzim 2021.