IA161 Natural Language Processing in Practice

Fakulta informatiky
podzim 2024
Rozsah
1/1/0. 2 kr. (plus ukončení). Ukončení: k.
Vyučováno kontaktně
Vyučující
doc. RNDr. Aleš Horák, Ph.D. (přednášející)
RNDr. Zuzana Nevěřilová, Ph.D. (přednášející)
doc. Mgr. Pavel Rychlý, Ph.D. (pomocník)
RNDr. Miloš Jakubíček, Ph.D. (pomocník)
RNDr. Marek Medveď, Ph.D. (pomocník)
Mgr. Radoslav Sabol (pomocník)
RNDr. Vít Suchomel, Ph.D. (pomocník)
Garance
doc. RNDr. Aleš Horák, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
St 25. 9. až St 11. 12. St 10:00–11:50 A219
Předpoklady
All students should have basic practical knowledge of programming in Python. Overview knowledge of the natural language processing field at the level of introductory courses such as IB030 Úvod do počítačového zpracování přirozeného jazyka or PA153 Natural Language Processing is expected. The seminar is given in English. Task solutions can be in English, Czech or Slovak.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 52 mateřských oborů, zobrazit
Cíle předmětu
The course participants will have the opportunity to learn about, test and experiment with advanced techniques of natural language processing (NLP) and to develop an understanding of the limits of those techniques. The course aims to introduce current research issues, and to meet in practice with particular programming techniques used in language technology applications.
Výstupy z učení
After studying the course, the students will be able to:
- explain a selected NLP problem and list its main aspects;
- implement a basic or intermediate application for complex tasks in language processing, typically for Czech, Slovak, or English;
- create data resources (models, test sets) for a selected NLP problem and evaluate their assets;
- compare selected available tools for complex NLP tasks and apply them to chosen data resources with possible adaptations to particular purposes.
Osnova
  • The presented NLP problems will concentrate on practical problems connected with processing human-produced textual data. Particular topics include:
  • Opinion mining, sentiment analysis
  • Machine translation
  • Parsing of Czech: Between Rules and Statistics
  • Named Entity Recognition
  • Building Language Resources from the Web (effective crawling, boilerplate removal, tokenisation, near duplicates identification)
  • Language modelling
  • Topic identification, topic modelling
  • Extracting structured information from text
  • Automatic relation extraction (hypernyms, synonyms, ...)
  • Adaptive electronic dictionaries
  • Terminology identification (keywords, key phrases)
  • Anaphora resolution
  • Stylometry
  • Automatic language corrections
Literatura
  • Dan Jurafsky and James H. Martin. Speech and Language Processing (2020, 3rd ed. draft). https://web.stanford.edu/~jurafsky/slp3/
  • J. Eisenstein, Introduction to Natural Language Processing (2019), MIT Press.
  • https://www.aclweb.org/anthology/
Výukové metody
Each lecture consists of a one-hour lesson about the theoretical issues connected with a particular NLP problem, and a one-hour practical work in a computer laboratory devoted to the implementation, adaptation and evaluation of the presented techniques on real-world data.
Metody hodnocení
Solving tasks in the practical part of the lecture or in homeworks.
Vyučovací jazyk
Angličtina
Informace učitele
http://nlp.fi.muni.cz/NlpInPracticeCourse
Since autumn 2025 the course code changes from IA161 to IV161 NLP in Practice.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2011, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2019, podzim 2020, podzim 2021, podzim 2022, podzim 2023.
  • Statistika zápisu (nejnovější)
  • Permalink: https://is.muni.cz/predmet/fi/podzim2024/IA161