E7541 Analýza dat na PC

Přírodovědecká fakulta
podzim 2022
Rozsah
0/2/0. 2 kr. (plus ukončení). Ukončení: z.
Vyučující
RNDr. Jiří Jarkovský, Ph.D. (cvičící)
RNDr. Denisa Krejčí, Ph.D. (cvičící)
Mgr. et Mgr. Jiří Kalina, Ph.D. (cvičící)
Zbyněk Cincibus (pomocník)
prof. RNDr. Ladislav Dušek, Ph.D. (cvičící)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Jiří Jarkovský, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Rozvrh
Po 14:00–15:50 D29/347-RCX2
Předpoklady
Bi5040 Biostatistika - základní kurz nebo libovolný kurz biostatistiky, základy práce s PC
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Předmět je úvodem do praktické analýzy dat pro studenty biologických a případně klinických vědních oborů. Látka navazuje na teoretickou výuku biostatistiky z pohledu praktického řešení problémů analýzy dat ve statistických software (popisná statistika, jednovýběrové a dvouvýběrové testy, testy pro kategoriální data, ANOVA, korelační a regresní analýza, vizualizace dat, základy experimentálního designu). Kurz vede k osvojení základních principů biostatistické analýzy dat a připravuje uchazeče k jejímu samostatnému využití ve vlastní vědecké práci.
Výstupy z učení
Na konci prakticky orientovaného kurzu je student schopen: Využít MS Excel pro předpřípravu dat pro analýzu Využít software Statistica for Windows pro praktickou analýzu dat Vizualizace dat pomocí grafů v MS Office a Statistica for Windows Aplikace popisné statistiky v Statistica for Windows Aplikace statistických testů v Statistica for Windows
Osnova
  • 1. Využití aplikace MS Excel pro základní ukládání, transformaci, čištění a další operace s daty. Cílem je poskytnout posluchači znalosti k práci s daty v listech MS Excelu, jejich zviditelnění, vytváření přehledů, vytváření grafů a používání funkcí. Základní úkony: Nastavení Excelu; datové listy a jejich vlastnosti; buňky a jejich vlastnosti; automatické, podmíněné formátování a styly. Práce s daty: Řazení a filtrování dat; rozdělení obsahu buňky; přehledy; kontingenční tabulky a grafy. Grafy a funkce v MS Excel: Typy grafů a jejich použití; editace grafů; kombinace grafů; použití funkcí v MS Excelu; vybrané statistické a matematické funkce a jejich využití. 2. Základy ovládání software Statistica for Windows a práce s daty. Seznámení s programem; instalace programu Statistica (systémové požadavky, instalace); organizace nabídek a logika práce s programem;, přehled jednotlivých menu, nastavení programu, práce s nápovědou, internetové stánky; Práce s daty; import dat (načtení dat z MS Excel, textových a databázových souborů, struktura souborů); Operace s daty (typy proměnných, úpravy záznamů a proměnných, odvozené a vypočítané proměnné - transformace, transponování, chybějící hodnoty); výstup výsledků; typy výstupů export grafů a tabulek (výstupní formáty grafů, výstupní formáty tabulek); spolupráce s programy MS Office (vkládání tabulek a grafů do dokumentů Office, jejich úpravy) 3. Deskriptivní analýza, modul "Basic statistics" programu Statistica. Popisná statistika; popisné parametry proměnných (průměr, směrodatná odchylka, standardní chyba, medián, kvantity, rozsah hodnot, šikmost, špičatost); popisné grafy a tabulky (histogram, box and whisker plot, frekvenční tabulky); normalita dat (Kolgomorov-Smirnovův test normality, Shapiro-Wilk`s test) Grafy; základní typy grafů (scatter plot, histogram, box and whisker plot, sloupcové, koláčové a čárové grafy); matice grafů a speciální typy grafů (matrix plots, categorized plots, 3D grafy); korelace parametrická (Pearsonův korelační koeficient, partial correlation); korelace neparametrická (Spearman, Kendal Tau, Gamma). 4. Testování a analýza dat. Parametrické testy; one sample t-test (předpoklady, využití); two sample t-test (two sample t-test s závislými a nezávislými proměnnými, předpoklady, využití); F-test (porovnání rozptylů); Neparametrické testy; srovnání dvou nezávislých vzorků (Man-Whitney U test, Kolgomorov-Smirnovův test); srovnání dvou závislých vzorků (Wilcoxonův test, znaménkový test); srovnání více nezávislých vzorků (Kruskal-Wallis ANOVA, mediánový test); one way ANOVA (předpoklady, využití)
Literatura
  • Petrie, A., Watson, P. (2006) Statistics for Veterinary and Animal Science, Wiley-Blackwell; 2nd ed
  • Sokal, R.R., Rohlf, F.J. (1994) Biometry, W. H. Freeman, 3th ed.
  • Zar, J.H. (1998) Biostatistical analysis. Prentice Hall, London. 4th ed.
  • http://www.statsoft.com/textbook/stathome.html
Výukové metody
Cvičení na počítačích
Metody hodnocení
Individuální projekt korektní aplikace statistických metod na příkladových datech.
Navazující předměty
Informace učitele
http://www.cba.muni.cz/vyuka/
Další komentáře
Studijní materiály
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2023, podzim 2024.