E7541 Analýza dat na PC

Přírodovědecká fakulta
podzim 2025
Rozsah
0/2/0. 2 kr. (plus ukončení). Ukončení: z.
Vyučováno kontaktně
Vyučující
Mgr. et Mgr. Jiří Kalina, Ph.D. (cvičící)
RNDr. Jiří Jarkovský, Ph.D. (cvičící)
Garance
Mgr. et Mgr. Jiří Kalina, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: Mgr. et Mgr. Jiří Kalina, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Rozvrh
Po 13:00–14:50 D29/347-RCX2
Předpoklady
Bi5040 Biostatistika - základní kurz nebo libovolný kurz biostatistiky, základy práce s PC
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Anotace
Předmět je úvodem do praktické analýzy dat pro studenty biologických a případně klinických vědních oborů. Látka navazuje na teoretickou výuku biostatistiky z pohledu praktického řešení problémů analýzy dat ve statistických software (popisná statistika, jednovýběrové a dvouvýběrové testy, testy pro kategoriální data, ANOVA, korelační a regresní analýza, vizualizace dat, základy experimentálního designu). Kurz vede k osvojení základních principů biostatistické analýzy dat a připravuje uchazeče k jejímu samostatnému využití ve vlastní vědecké práci.
Výstupy z učení
Na konci prakticky orientovaného kurzu je student schopen: Využít MS Excel pro předpřípravu dat pro analýzu Využít software Statistica nebo R pro praktickou analýzu dat Vizualizace dat pomocí grafů v MS Office a Statistica for Windows Aplikace popisné statistiky v Statistica for Windows Aplikace statistických testů v Statistica for Windows
Klíčová témata
1. Využití aplikace MS Excel pro základní ukládání, transformaci, čištění a další operace s daty. Cílem je poskytnout posluchači znalosti k práci s daty v listech MS Excelu, jejich zviditelnění, vytváření přehledů, vytváření grafů a používání funkcí. Základní úkony: Nastavení Excelu; datové listy a jejich vlastnosti; buňky a jejich vlastnosti; automatické, podmíněné formátování a styly. Práce s daty: Řazení a filtrování dat; rozdělení obsahu buňky; přehledy; kontingenční tabulky a grafy. Grafy a funkce v MS Excel: Typy grafů a jejich použití; editace grafů; kombinace grafů; použití funkcí v MS Excelu; vybrané statistické a matematické funkce a jejich využití. 2. Základy ovládání software Statistica nebo R a práce s daty. Seznámení s programem; instalace programu (systémové požadavky, instalace); organizace nabídek a logika práce s programem;, přehled jednotlivých menu, nastavení programu, práce s nápovědou, internetové stánky; Práce s daty; import dat (načtení dat z MS Excel, textových a databázových souborů, struktura souborů); Operace s daty (typy proměnných, úpravy záznamů a proměnných, odvozené a vypočítané proměnné - transformace, transponování, chybějící hodnoty); výstup výsledků; typy výstupů export grafů a tabulek (výstupní formáty grafů, výstupní formáty tabulek); spolupráce s programy MS Office (vkládání tabulek a grafů do dokumentů Office, jejich úpravy) 3. Popisná statistika; popisné parametry proměnných (průměr, směrodatná odchylka, standardní chyba, medián, kvantity, rozsah hodnot, šikmost, špičatost); popisné grafy a tabulky (histogram, box and whisker plot, frekvenční tabulky); normalita dat (Kolgomorov-Smirnovův test normality, Shapiro-Wilk`s test) Grafy; základní typy grafů (scatter plot, histogram, box and whisker plot, sloupcové, koláčové a čárové grafy); matice grafů a speciální typy grafů (matrix plots, categorized plots, 3D grafy); korelace parametrická (Pearsonův korelační koeficient, partial correlation); korelace neparametrická (Spearman, Kendal Tau, Gamma). 4. Testování a analýza dat. Parametrické testy; one sample t-test (předpoklady, využití); two sample t-test (two sample t-test s závislými a nezávislými proměnnými, předpoklady, využití); F-test (porovnání rozptylů); Neparametrické testy; srovnání dvou nezávislých vzorků (Man-Whitney U test, Kolgomorov-Smirnovův test); srovnání dvou závislých vzorků (Wilcoxonův test, znaménkový test); srovnání více nezávislých vzorků (Kruskal-Wallis ANOVA, mediánový test); one way ANOVA (předpoklady, využití)
Studijní zdroje a literatura
  • Petrie, A., Watson, P. (2006) Statistics for Veterinary and Animal Science, Wiley-Blackwell; 2nd ed
  • Sokal, R.R., Rohlf, F.J. (1994) Biometry, W. H. Freeman, 3th ed.
  • Zar, J.H. (1998) Biostatistical analysis. Prentice Hall, London. 4th ed.
  • http://www.statsoft.com/textbook/stathome.html
Přístupy, postupy a metody používané ve výuce
Teoretický výklad a cvičení na počítačích
Způsob ověření výstupů z učení a požadavky na ukončení
Test založený na řešení čtyř úloh datové analýzy na reálných datech.
Navazující předměty
Odkaz a informace vyučujících
https://portal.matematickabiologie.cz/index.php?pg=aplikovana-analyza-klinickych-a-biologickych-dat--biostatistika-pro-matematickou-biologii
Anglická verze předmětu je vyučována jako kurz E0410 Fundamentals of Statistics for Scientific Data Using R.
Další komentáře
Studijní materiály
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2022, podzim 2023, podzim 2024.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/sci/podzim2025/E7541