Bi8700 Topics on data management, analysis and visualization

Faculty of Science
Spring 2019
Extent and Intensity
0/1/0. 2 credit(s). Type of Completion: z (credit).
Teacher(s)
RNDr. Martin Komenda, Ph.D. (lecturer)
Mgr. Matěj Karolyi (lecturer)
Mgr. Martin Víta (lecturer)
Mgr. Jakub Ščavnický (lecturer)
Guaranteed by
RNDr. Martin Komenda, Ph.D.
RECETOX - Faculty of Science
Contact Person: RNDr. Martin Komenda, Ph.D.
Supplier department: RECETOX - Faculty of Science
Prerequisites (in Czech)
Předpokladem je zájem o oblast zpracování, analýzy a vizualizace dat.
Course Enrolment Limitations
The course is also offered to the students of the fields other than those the course is directly associated with.
The capacity limit for the course is 12 student(s).
Current registration and enrolment status: enrolled: 7/12, only registered: 0/12, only registered with preference (fields directly associated with the programme): 0/12
fields of study / plans the course is directly associated with
Course objectives (in Czech)
Předmět detailně představí vybraná témata z oblasti zpracování, analýzy a vizualizace dat. Vždy budou vybrány 4 aktuální projekty, která budou ve formě interaktivních workshopů pod vedením zkušených mentorů prezentovat použití ověřených metodik a metod dolování dat, analytických postupů a technik v praxi. Každá část bude vždy rozdělena na blok představující nezbytné teoretické pozadí a blok, který se bude věnovat praktickým výstupům a řešení výzkumných otázek ve spolupráci se studenty.
Learning outcomes (in Czech)
Student porozumí potřebnosti systematického používání metodik a metod pro dolování dat.
Student se seznámí s aktuálními trendy ve zpracování, analýzu a vizualizaci dat.
Student si osvojí nové postupy při řešení zadaných výzkumných problémů.
Syllabus (in Czech)
  • Témata pro období jaro 2019 jsou následující:
  • - Mapování medicínského kurikula – blok věnovaný pochopení problematiky budování, struktury, správy a mapování medicínských studijních programů. V souladu s metodikou CRISP-DM budou představena řešení konkrétních úloh společně s reálnými výstupy v podobě interaktivních analýz a reportů.
  • - Strojové zpracování a analýza – studenti budou seznámeni s technikami strojového procházení, zpracování a ukládání textového obsahu z elektronických zdrojů. Pozornost bude zaměřena především na automatizaci celého procesu s použitím vhodných nástrojů a knihoven třetích stran. Po vhodném předzpracování uložených dat proběhne analýza a popis základních statistických charakteristik datové sady.
  • - Výběr správné vizualizace a „data storytelling“ – v rámci přednášky a průběžných aktivit tohoto bloku bude věnován důraz na kritické uvažování při výběru koncové vizualizace, která bude prezentována publiku. Budou probírána témata související s touto problematikou: (i) rozdíly mezi průzkumovou a vysvětlující analýzou, (ii) vyprávění příběhů pomocí dat, (iii) příběhové struktury, (vi) autorem vs. uživatelem řízené vizualizace, (v) výhody a nevýhody různých typů grafů. Studenti si prakticky vyzkouší některé z prezentovaných technik na modelových úkolech.
  • - Deep learning (2 bloky) – nejprve budou vyloženy hlavní principy a pojmy z oblasti neuronových sítí a jejich základní architektury (dopředné: fully connected a konvoluční, dále pak rekurentní: LSTM). Následovat bude praktická implementace těchto architektur pro řešení jednoduchých klasifikačních a regresních úloh z různých oblastí (mj. zpracování obrazu, zpracování přirozeného jazyka). K tomuto účelu bude využito prostředí R + knihovna Keras. Informativně budou zmíněny též regularizační techniky (především dropout) a principy transfer learningu a využití předtrénovaných modelů. V závěru se podíváme na workflow vývoje deep learningových modelů za pomoci knihovny tfruns.
Assessment methods (in Czech)
Docházka – účast 100 %. Aktivní účast na seminářích.
Language of instruction
Czech
Further comments (probably available only in Czech)
Study Materials
The course is taught annually.
The course is taught: in blocks.
The course is also listed under the following terms Spring 2020.
  • Enrolment Statistics (Spring 2019, recent)
  • Permalink: https://is.muni.cz/course/sci/spring2019/Bi8700