FI:PB106 Corpus Linguistic Project I - Informace o předmětu
PB106 Corpus Linguistic Project I
Fakulta informatikypodzim 2024
- Rozsah
- 0/2/0. 2 kr. (plus ukončení). Ukončení: z.
Vyučováno kontaktně - Vyučující
- doc. Mgr. Pavel Rychlý, Ph.D. (přednášející)
- Garance
- doc. Mgr. Pavel Rychlý, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Pá 27. 9. až Pá 20. 12. Pá 10:00–11:50 A217, kromě Pá 22. 11. ; a Pá 22. 11. 10:00–11:50 A220
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 36 mateřských oborů, zobrazit
- Cíle předmětu
- Účelem pracovního semináře je hlubší seznámení s vybranou
oblastí korpusové lingvistiky řešenou v Centru
zpracování přirozeného jazyka a aplikace získaných
poznatků při zpracování samostatného projektu.
Základní informace o Centru zpracování přirozeného jazyka a korpusové lingvistice lze nalézt na adrese http://nlp.fi.muni.cz/. - Výstupy z učení
- Student bude po absolvování předmětu schopen: vytvořit textový korpus z různých zdrojů; použít automatické nástroje pro anotaci korpusů nebo získávání informací z korpusů; vyhodnotit úspěšnost automatických nástrojů; prezentovat výsledky vyhodnocení.
- Osnova
- seznámení se s tématy: textové korpusy, paralelní korpusy, značkování, statistiky, uživatelská rozhraní
- výběr projektu
- řešení projektu
- prezentace výsledků projektů a diskuse
- Literatura
- EISENSTEIN, Jacob. Introduction to natural language processing. Cambridge, Massachusetts: MIT Press, 2019, xiv, 519. ISBN 9780262042840. info
- JURAFSKY, Dan a James H. MARTIN. Speech and language processing : an introduction to natural language processing, computational linguistics and speech recognition. 2nd ed. New Jersey: Pearson, 2009, 1024 s. ISBN 9780135041963. info
- JACKSON, Peter a Isabelle MOULINIER. Natural language processing for online applications : text retrieval, extraction and categorization. Amsterdam: John Benjamins Publishing Company, 2002, x, 225. ISBN 902724989X. info
- MANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999, xxxvii, 68. ISBN 0-262-13360-1. info
- Corpus processing for lexical acquisition. Edited by Bran Boguraev - J. (James) Pustejovsky. Cambridge: Bradford Book, 1996, xi, 245 s. ISBN 0-262-02392-X. info
- Výukové metody
- přednášky, práce na samostatném projektu, osobní konzultace, prezentace
- Metody hodnocení
- Projekt. Hodnocení na základě prezentace výsledků dosažených při řešení projektu.
- Vyučovací jazyk
- Angličtina
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/podzim2024/PB106