PA153 Natural Language Processing
Fakulta informatikypodzim 2024
- Rozsah
- 2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučováno kontaktně - Vyučující
- doc. Mgr. Pavel Rychlý, Ph.D. (přednášející)
RNDr. Zuzana Nevěřilová, Ph.D. (pomocník) - Garance
- doc. Mgr. Pavel Rychlý, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. Mgr. Pavel Rychlý, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Po 23. 9. až Po 16. 12. Po 12:00–13:50 D1
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Analýza a zpracování obrazu (program FI, N-VIZ)
- Bioinformatika a systémová biologie (program FI, N-UIZD)
- Computer Games Development (program FI, N-VIZ_A)
- Computer Graphics and Visualization (program FI, N-VIZ_A)
- Computer Networks and Communications (program FI, N-PSKB_A)
- Cybersecurity Management (program FI, N-RSSS_A)
- Digitální lingvistika (program FI, N-DL)
- Diskrétní algoritmy a modely (program FI, N-TEI)
- Formální analýza počítačových systémů (program FI, N-TEI)
- Grafický design (program FI, N-VIZ)
- Graphic Design (program FI, N-VIZ_A)
- Hardware Systems (program FI, N-PSKB_A)
- Hardwarové systémy (program FI, N-PSKB)
- Image Processing and Analysis (program FI, N-VIZ_A)
- Informační bezpečnost (program FI, N-PSKB)
- Information Security (program FI, N-PSKB_A)
- Kvantové a jiné neklasické výpočetní modely (program FI, N-TEI)
- Počítačová grafika a vizualizace (program FI, N-VIZ)
- Počítačová lingvistika (program FF, N-PLIN_) (3)
- Počítačové sítě a komunikace (program FI, N-PSKB)
- Principy programovacích jazyků (program FI, N-TEI)
- Řízení kyberbezpečnosti (program FI, N-RSSS)
- Řízení vývoje služeb (program FI, N-RSSS)
- Řízení vývoje softwarových systémů (program FI, N-RSSS)
- Services Development Management (program FI, N-RSSS_A)
- Software Systems Development Management (program FI, N-RSSS_A)
- Softwarové systémy (program FI, N-PSKB)
- Strojové učení a umělá inteligence (program FI, N-UIZD)
- Vývoj počítačových her (program FI, N-VIZ)
- Zpracování a analýza rozsáhlých dat (program FI, N-UIZD)
- Zpracování přirozeného jazyka (program FI, N-UIZD)
- Cíle předmětu
- Předmět nabízí seznámení s počítačovým zpracováním přirozeného jazyka pomocí statistických algoritmů i neuronových sítí hlubokého učení. Jednotlivé přístupy jsou ilustrovány na funkčních příkladech či aplikacích.
- Výstupy z učení
- Studenti získají znalosti o praktickém zpracování textů.
Student bude po absolvování předmětu schopen:
- porozumět metodám zpracování textů;
- navrhnout algoritmy na klasifikaci textů, dokumentů, vět;
- porozumět struktuře systémů odpovídání na otázky a strojového překladu;
- vyhodnotit kvalitu aplikací zpracování přirozeného jazyka. - Osnova
- zpracování textu, tokenizace, korpusy
- četnosti slov, n-gramy, jazykové modelování
- klasifikace textů
- extrakce informací
- morfologické a syntaktické značkování
- získávání informací, odpovídání na otázky
- paralelní texty, zarovnávání slov, strojový překlad
- reprezentace ve spojitých prostorech
- rekurentní neuronové sítě pro jazykové modelování
- zpracování sekvencí, transformery
- neuronový strojový překlad
- generování přirozeného jazyka, obrovské jazykové modely
- Literatura
- doporučená literatura
- GOODFELLOW, Ian, Yoshua BENGIO a Aaron COURVILLE. Deep learning. London, England: MIT Press, 2016, xxii, 775. ISBN 9780262035613. info
- JURAFSKY, Dan a James H. MARTIN. Speech and language processing : an introduction to natural language processing, computational linguistics and speech recognition. 2nd ed. New Jersey: Pearson, 2009, 1024 s. ISBN 9780135041963. info
- Výukové metody
- Výuka probíhá formou přednášek a seminářů, v nichž se kombinuje ústní projev učitele s použitím slidů a ukázek relevantních softwarových nástrojů. Studenti vypracovávají dobrovolné domácí úkoly nebo menší projekty. Na vhodných místech výuky se pracuje formou otevřeného dialogu mezi učitelem a studenty.
- Metody hodnocení
- Na závěrečnou písemnou zkoušku je možné získat 50 bodů. K úspěšnému zvládnutí je potřeba dosáhnout alespoň 25 bodů. Až 25 bodů je možné získat za řešení domácích úkolů či projektů.
- Vyučovací jazyk
- Angličtina
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2024/PA153