Bi8700 Vybrané kapitoly ze zpracování, analýzy a vizualizace dat

Přírodovědecká fakulta
jaro 2021
Rozsah
0/1/0. 2 kr. Ukončení: z.
Vyučující
RNDr. Martin Komenda, Ph.D. (přednášející)
Mgr. Martin Víta, Ph.D. (přednášející)
Bc. Petr Panoška (přednášející)
Bc. Miloš Hejný (přednášející)
Garance
RNDr. Martin Komenda, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Martin Komenda, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Předpoklady
Předpokladem je zájem o oblast zpracování, analýzy a vizualizace dat.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 12 stud.
Momentální stav registrace a zápisu: zapsáno: 1/12, pouze zareg.: 0/12, pouze zareg. s předností (mateřské obory): 0/12
Mateřské obory/plány
Cíle předmětu
Předmět detailně představí vybraná témata z oblasti zpracování, analýzy a vizualizace dat. Vždy budou vybrány aktuální projekty, která budou ve formě interaktivních workshopů pod vedením zkušených mentorů prezentovat použití ověřených metodik a metod dolování dat, analytických postupů a technik v praxi. Každá část bude vždy rozdělena na blok představující nezbytné teoretické pozadí a blok, který se bude věnovat praktickým výstupům a řešení výzkumných otázek ve spolupráci se studenty.
Výstupy z učení
Student porozumí potřebnosti systematického používání metodik a metod pro dolování dat.
Student se seznámí s aktuálními trendy ve zpracování, analýzu a vizualizaci dat.
Student si osvojí nové postupy při řešení zadaných výzkumných problémů.
Osnova
  • Témata pro období jaro 2021 jsou následující:
  • Mapování medicínského kurikula – blok věnovaný pochopení problematiky budování, struktury, správy a mapování medicínských studijních programů. V souladu s metodikou CRISP-DM budou představena řešení konkrétních úloh společně s reálnými výstupy v podobě interaktivních analýz a reportů.
  • Otevřená data: analýza a zpracovaní – studenti budou seznámeni s konceptem otevřených dat (open data) a v rámci jednoho bloku se zaměří na vypracování úkolu, který bude obsahovat vybrané kroky ze zpracování, analýzy a vizualizace vhodné datové sady.
  • Výběr správné vizualizace a „data storytelling“ – v rámci přednášky a průběžných aktivit tohoto bloku je věnován důraz na kritické uvažování při výběru koncové vizualizace, která bude prezentována publiku. Jsou probírána následující témata: (i) rozdíly mezi průzkumovou a vysvětlující analýzou, (ii) vyprávění příběhů pomocí dat, (iii) příběhové struktury, (vi) autorem vs. uživatelem řízené vizualizace, (v) výhody a nevýhody různých typů grafů. Studenti si prakticky vyzkouší některé z prezentovaných technik na modelových úkolech. Půjde především o vizualizaci dat na webu za pomoci Google Data Studio a Javascriptových knihoven. Modelové úkoly jsou zasazeny do kontextu otevřených dat České republiky.
  • Deep learning a NLP (2 bloky) – nejprve budou vyloženy hlavní principy a pojmy z oblasti neuronových sítí a jejich základní architektury (CNN a RNN/LSTM). Následovat bude praktická část zahájená představením knihovny Keras v prostředí R, na kterou bude navazovat seznámení se základními principy zpracování přirozeného jazyka v kontextu deep learningu. V rámci těchto dvou bloků bude týmově řešena konkrétní klasifikační úloha týkající se predikce Alzheimerovy choroby na základě textových dat (v AJ).
Výukové metody
Výuka probíhá prakticky. Tři hodiny dlouhé přednáškové bloky prokládané interakcemi se studenty (interaktivní kvízy, zjednodušené úkoly k vypracování, aplikace CRISP-DM na doménu, diskuse ve dvojicích).
Metody hodnocení
Docházka – účast min. 80 %. Aktivní účast na seminářích.
Informace učitele
Výuka probíhá blokově.
Poznámka k četnosti výuky: Výuka pro semestr jaro 2021 bude probíhat 5 x za semestr v blocích (2,5 hodiny) v kampusu MU v Bohunicích (učebna bude specifikována emailem v dostatečném předstihu). Tyto bloky budou prokládané interakcemi se studenty (interaktivní kvízy, zjednodušené úkoly k vypracování, aplikace CRISP-DM na doménu, diskuse ve dvojicích). Na lekcích budou přítomni všichni lektoři.

Terminy pro období jaro 2021 budou upřesněny.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Výuka probíhá blokově.
Předmět je zařazen také v obdobích jaro 2019, jaro 2020.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/sci/jaro2021/Bi8700