E7541 Analýza dat na PC

Přírodovědecká fakulta
podzim 2024
Rozsah
0/2/0. 2 kr. (plus ukončení). Ukončení: z.
Vyučováno prezenčně.
Vyučující
RNDr. Jiří Jarkovský, Ph.D. (cvičící)
RNDr. Denisa Krejčí, Ph.D. (cvičící)
Mgr. et Mgr. Jiří Kalina, Ph.D. (cvičící)
Zbyněk Cincibus (pomocník)
prof. RNDr. Ladislav Dušek, Ph.D. (cvičící)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Jiří Jarkovský, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Předpoklady
Bi5040 Biostatistika - základní kurz nebo libovolný kurz biostatistiky, základy práce s PC
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Předmět je úvodem do praktické analýzy dat pro studenty biologických a případně klinických vědních oborů. Látka navazuje na teoretickou výuku biostatistiky z pohledu praktického řešení problémů analýzy dat ve statistických software (popisná statistika, jednovýběrové a dvouvýběrové testy, testy pro kategoriální data, ANOVA, korelační a regresní analýza, vizualizace dat, základy experimentálního designu). Kurz vede k osvojení základních principů biostatistické analýzy dat a připravuje uchazeče k jejímu samostatnému využití ve vlastní vědecké práci.
Výstupy z učení
Na konci prakticky orientovaného kurzu je student schopen: Využít MS Excel pro předpřípravu dat pro analýzu Využít software Statistica nebo R pro praktickou analýzu dat Vizualizace dat pomocí grafů v MS Office a Statistica for Windows Aplikace popisné statistiky v Statistica for Windows Aplikace statistických testů v Statistica for Windows
Osnova
  • 1. Využití aplikace MS Excel pro základní ukládání, transformaci, čištění a další operace s daty. Cílem je poskytnout posluchači znalosti k práci s daty v listech MS Excelu, jejich zviditelnění, vytváření přehledů, vytváření grafů a používání funkcí. Základní úkony: Nastavení Excelu; datové listy a jejich vlastnosti; buňky a jejich vlastnosti; automatické, podmíněné formátování a styly. Práce s daty: Řazení a filtrování dat; rozdělení obsahu buňky; přehledy; kontingenční tabulky a grafy. Grafy a funkce v MS Excel: Typy grafů a jejich použití; editace grafů; kombinace grafů; použití funkcí v MS Excelu; vybrané statistické a matematické funkce a jejich využití. 2. Základy ovládání software Statistica nebo R a práce s daty. Seznámení s programem; instalace programu (systémové požadavky, instalace); organizace nabídek a logika práce s programem;, přehled jednotlivých menu, nastavení programu, práce s nápovědou, internetové stánky; Práce s daty; import dat (načtení dat z MS Excel, textových a databázových souborů, struktura souborů); Operace s daty (typy proměnných, úpravy záznamů a proměnných, odvozené a vypočítané proměnné - transformace, transponování, chybějící hodnoty); výstup výsledků; typy výstupů export grafů a tabulek (výstupní formáty grafů, výstupní formáty tabulek); spolupráce s programy MS Office (vkládání tabulek a grafů do dokumentů Office, jejich úpravy) 3. Popisná statistika; popisné parametry proměnných (průměr, směrodatná odchylka, standardní chyba, medián, kvantity, rozsah hodnot, šikmost, špičatost); popisné grafy a tabulky (histogram, box and whisker plot, frekvenční tabulky); normalita dat (Kolgomorov-Smirnovův test normality, Shapiro-Wilk`s test) Grafy; základní typy grafů (scatter plot, histogram, box and whisker plot, sloupcové, koláčové a čárové grafy); matice grafů a speciální typy grafů (matrix plots, categorized plots, 3D grafy); korelace parametrická (Pearsonův korelační koeficient, partial correlation); korelace neparametrická (Spearman, Kendal Tau, Gamma). 4. Testování a analýza dat. Parametrické testy; one sample t-test (předpoklady, využití); two sample t-test (two sample t-test s závislými a nezávislými proměnnými, předpoklady, využití); F-test (porovnání rozptylů); Neparametrické testy; srovnání dvou nezávislých vzorků (Man-Whitney U test, Kolgomorov-Smirnovův test); srovnání dvou závislých vzorků (Wilcoxonův test, znaménkový test); srovnání více nezávislých vzorků (Kruskal-Wallis ANOVA, mediánový test); one way ANOVA (předpoklady, využití)
Literatura
  • Petrie, A., Watson, P. (2006) Statistics for Veterinary and Animal Science, Wiley-Blackwell; 2nd ed
  • Sokal, R.R., Rohlf, F.J. (1994) Biometry, W. H. Freeman, 3th ed.
  • Zar, J.H. (1998) Biostatistical analysis. Prentice Hall, London. 4th ed.
  • http://www.statsoft.com/textbook/stathome.html
Výukové metody
Teoretický výklad a cvičení na počítačích
Metody hodnocení
Test založený na řešení čtyř úloh datové analýzy na reálných datech.
Navazující předměty
Informace učitele
https://portal.matematickabiologie.cz/index.php?pg=aplikovana-analyza-klinickych-a-biologickych-dat--biostatistika-pro-matematickou-biologii
Anglická verze předmětu je vyučována jako kurz E0410 Fundamentals of Statistics for Scientific Data Using R.
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Poznámka k četnosti výuky: možno i blokově.
Předmět je zařazen také v obdobích podzim 2022, podzim 2023.