FF:PLIN037 Sémantika a počítače - Informace o předmětu
PLIN037 Sémantika a počítače
Filozofická fakultajaro 2025
- Rozsah
- 0/2/0. 4 kr. Ukončení: z.
- Vyučující
- RNDr. Zuzana Nevěřilová, Ph.D. (přednášející)
- Garance
- RNDr. Zuzana Nevěřilová, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 0/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30 - Mateřské obory/plány
- Digitální lingvistika (program FI, N-DL)
- Počítačová lingvistika (program FF, N-PLIN_) (3)
- Cíle předmětu
- Na konci tohoto kurzu bude student schopen porozumět termínům z oblasti formálního a počítačového zpracování sémantické roviny jazyka; porozumět problematice vícenásobné anotace a meizanotátorské shody; použít existující znalostní báze a znát jejich výhody a nevýhody; rozumět termínu linked open data (LOD); používat technologie sémantického webu; porozumět sémantickým sítím; vysvětlit principy odvozování v sémantických sítích; interpretovat pravděpodobnostní modely významu; rozumět modelování významu pomocí word embeddings; porozumět a vysvětlit anaforické vztahy a algoritmy pro jejich automatickou detekci
- Výstupy z učení
- Student bude po absolvování předmětu schopen:
- identifikovat problém počítačového zpracování přirozeného jazyka jako problém sémantického zpracování,
- navrhnout anotační schéma a metody vyhodnocení anotace,
- aplikovat znalostní bázi na konkrétní úlohu,
- aplikovat předtrénovaný jazykový model na konkrétní úlohu,
- určit slabá místa automatického zpracování. - Osnova
- 1. Hledání významu: víceznačnost na různých úrovních analýzy.
- 2. Sémantická anotace: problém shody mezi anotátory.
- 3. Formální reprezentace znalostí: výběrová omezení, sémantické rysy, sémantické sítě a rámce, psychologické experimenty.
- 4. Sémantické relace mezi větami, vyplývání a implikace, odvozování znalostí v sém. sítích.
- 5. Formální jazyky pro reprezentaci znalostí: RDF, OWL. Linked open data.
- 6. Pravděpodobnostní modely.
- 7. Word embeddings. Předtrénované modely.
- 8. Analýza diskurzu, rozpoznávání anafor.
- Literatura
- doporučená literatura
- GODDARD, Cliff. Semantic Analysis : a practical introduction. Oxford: Oxford University Press, 1998, xv, 411 s. ISBN 0-19-870017-2. info
- Výukové metody
- Přednáška, výukové materiály v ISu (prezentace, videa). Cvičení na počítači, nejčastěji formou Jupyter Notebooku v prostředí Colab (není nutná žádná instalace software).
- Metody hodnocení
- Prezentace aktuálního vědeckého článku nebo aktuálního tématu z oblasti (podle vlastního výběru).
- Informace učitele
- Studijní literatura a studijní pomůcky:
J. ALLEN: Natural Language Understanding, 2nd. ed. Benjamin-Cummings Publishing Co., Inc., 1995.
CH. FELLBAUM: WordNet: An Electronic Lexical Database (Language, Speech, and Communication), The MIT Press, May 1998.
C. J. FILLMORE: The Case for Case, The Ohio State University, 1967.
K. K. SCHULER: VerbNet: A Broad-Coverage, Comprehensive Verb Lexicon, PhD Thesis, Faculties of the University of Pennsylvania, 2005.
N. SHADBOLT, W. HALL, T. BERNERS-LEE: The Semantic Web Revisited. IEEE Intelligent Systems, 2006. http://eprints.ecs.soton.ac.uk/12614/1/Semantic_Web_Revisted.pdf
https://www.deeplearning.ai/resources/natural-language-processing/
Prezentace z minulých let
https://nlp.fi.muni.cz/cs/OCemSeMluvi - Další komentáře
- Výuka probíhá každý týden.
- Statistika zápisu (jaro 2025, nejnovější)
- Permalink: https://is.muni.cz/predmet/phil/jaro2025/PLIN037