MA850 Statistická inference pro mnohorozměrná data

Přírodovědecká fakulta
podzim 2021
Rozsah
2/0/0. 2 kr. (příf plus uk plus > 4). Ukončení: zk.
Vyučováno prezenčně.
Vyučující
doc. PaedDr. RNDr. Stanislav Katina, Ph.D. (přednášející)
Garance
doc. PaedDr. RNDr. Stanislav Katina, Ph.D.
Ústav matematiky a statistiky - Ústavy - Přírodovědecká fakulta
Dodavatelské pracoviště: Ústav matematiky a statistiky - Ústavy - Přírodovědecká fakulta
Rozvrh
St 8:00–9:50 MP2,01014a
Předpoklady
M6120 Lineární statistické modely II, M7986 Statistická inference I a M8986 Statistická inference II.
Omezení zápisu do předmětu
Předmět je otevřen studentům libovolného oboru.
Cíle předmětu
Předmět se zabývá testováním statistických hypotéz o vektorech a maticích parametrů Waldovým principem, věrohodnostním poměrem a skóre principem, jejich implementací v jazyce R, geometrii, numerickou optimalizací a statistickou grafikou pro spojitá i diskrétní data. Na konci tohoto kurzu bude student schopen: (1) porozumět a vysvětlit metody parametrické statistické inference pro spojitá data i diskrétní data pro mnohorozměrné parametry (vektory a matice), (2) implementovat tyto metody v jazyce R, (3) aplikovat je na konkrétních datech.
Výstupy z učení
Student bude po absolvování předmětu schopen:
- porozumnět věrohodnosti a statistické inferenci vektorů a matic parametrů pro mnohorozměrné spojitá i disktétní data;
- vybrat vhodný pravděpodobností a statistický model pro statistickou inferenci vektorů a matic parametrů pro mnohorozměrné spojité i disktétní data;
- navrhnout a vysvětlit vhodné statistické testy vektorů a matic parametrů pro mnohorozměrné spojité i disktétní data;
- aplikovat metody statistické inference na reálná mnohorozměrné spojité i diskrétní data;
- implementovat metody statistické inference pro mnohorozměrné spojité i diskrétní data v R.
Osnova
  • Testování hypotéz pro vektor středních hodnot, vektor rozptylů, vektor korelačních koeficientů a vektor pravdépodobností (vícevýběrové případy, testy Waldovým principem, věrohodnostním poměrem a skóre principem), zobecnené testy s podmínkami.
  • Testování hypotéz pro vektory středních hodnot a kovarianční matice pro jedno-, dvou- a vícevýběrové případy, profilová analýza, MANOVA, zobecnené testy s podmínkami.
  • Testování hypotéz v mnohoproměnném lineárním regresním modelu o vektoru regresních koeficientů, o koeficientu mnohonásobné korelace a o parciálním korelačním koeficientu (testy Waldovým principem a věrohodnostním poměrem principem), zobecnění na mnohorozměrný mnohoproměnný lineární regresní model, zobecnené testy s podmínkami.
  • Analýza hlavných komponent, asymptotické vlastnosti hlavních komponentů (vlastních čísel a vektorů), normalizované (standardizované) hlavní komponenty, společné hlavní komponenty, faktorová analýza, diskriminační analýza, analýza kanonických korelací a korespondenční analýza.
  • Příklady v jazyce R. Aplikace na reálná data z biologie, medicíny a jiných oborů.
Literatura
    doporučená literatura
  • KATINA, Stanislav, Miroslav KRÁLÍK a Adéla HUPKOVÁ. Aplikovaná štatistická inferencia I. Biologická antropológia očami matematickej štatistiky. 1. vyd. Brno: Masarykova univerzita, 2015. 320 s. 1. ISBN 978-80-210-7752-2. info
  • Applied multivariate statistical analysis. Edited by Richard Arnold Johnson - Dean W. Wichern. 6th ed. Upper Saddle River, N.J.: Pearson Prentice Hall, 2007. xviii, 773. ISBN 9780131877153. info
  • MARIDA, K. V., J. T. KENT a J. M. BIBBY. Multivariate analysis. London: Academic press, 1979. xv, 518. ISBN 0124712525. info
Výukové metody
Přednášky: 2 hod. týdně. Online přes MS Teams nebo prezenčně podle vývoje epidemiologické situace a platných omezení.
Metody hodnocení
Domácí úkoly, ústní zkouška. Podmínky mohou být upřesněny podle vývoje epidemiologické situace a platných omezení.
Informace učitele
Výuka probíhá většinou v češtině nebo dle potřeby v angličtině, příslušná terminologie je za všech okolností uváděna i s anglickými ekvivalenty.
Mezi cílové dovednosti studia patří schopnost používat anglický jazyk pasivně i aktivně ve vlastní odbornosti a také v potenciálních oblastech aplikací matematiky.
Hodnocení ve všech případech může probíhat v češtině i v angličtině, dle volby studenta.
Přednášky budou probíhat online v MS Teams v době normálních přednášek podle rozvrhu. Vzhledem k možné nízké kvalitě signálu doporučuji studentům kameru nepoužívat. Otázky během přednášky nebude možné klást hlasem, ale prostřednictvím chatu.
Záznam z přednášky se bude nahrávat do IS průběžně a ne dopředu, tedy učiněn záznam se bude nahrávat až po dané přednášce a před další přednáškou. Záznam nemusí obsahovat kompletní přednášku, je na učiteli, co ze záznamu zveřejní a sdílený se studenty. Co je záznam z přednášky? Může jít o PDF textu, který přednášející píše elektronickým perem na obrazovku a tento může být doplněn hlasem (nebo hlasem a videem) přednášejícího. V IS budou vždy k dispozici slajdy v PDF s TeXovaným textem a budou se sdílet až po dané přednášce a před další přednáškou.
Konzultace k přednáškám budou probíhat pomocí diskuzního fóra, kde přednášející / cvičící jako moderátor moderuje tuto diskusi a nové diskusní fóra založené studenty nebudou brány v úvahu. Diskusní fóra budou založeny k jednotlivým přednáškám a cvičením (pokud předmět cvičení má) a k domácí úloze. Diskuze e-mailem probíhat nebudou.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2019, podzim 2020.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/sci/podzim2021/MA850