PLIN037 Sémantika a počítače

Filozofická fakulta
jaro 2025
Rozsah
0/2/0. 4 kr. Ukončení: z.
Vyučující
RNDr. Zuzana Nevěřilová, Ph.D. (přednášející)
Garance
RNDr. Zuzana Nevěřilová, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 0/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Mateřské obory/plány
Cíle předmětu
Na konci tohoto kurzu bude student schopen porozumět termínům z oblasti formálního a počítačového zpracování sémantické roviny jazyka; porozumět problematice vícenásobné anotace a meizanotátorské shody; použít existující znalostní báze a znát jejich výhody a nevýhody; rozumět termínu linked open data (LOD); používat technologie sémantického webu; porozumět sémantickým sítím; vysvětlit principy odvozování v sémantických sítích; interpretovat pravděpodobnostní modely významu; rozumět modelování významu pomocí word embeddings; porozumět a vysvětlit anaforické vztahy a algoritmy pro jejich automatickou detekci
Výstupy z učení
Student bude po absolvování předmětu schopen:
- identifikovat problém počítačového zpracování přirozeného jazyka jako problém sémantického zpracování,
- navrhnout anotační schéma a metody vyhodnocení anotace,
- aplikovat znalostní bázi na konkrétní úlohu,
- aplikovat předtrénovaný jazykový model na konkrétní úlohu,
- určit slabá místa automatického zpracování.
Osnova
  • 1. Hledání významu: víceznačnost na různých úrovních analýzy.
  • 2. Sémantická anotace: problém shody mezi anotátory.
  • 3. Formální reprezentace znalostí: výběrová omezení, sémantické rysy, sémantické sítě a rámce, psychologické experimenty.
  • 4. Sémantické relace mezi větami, vyplývání a implikace, odvozování znalostí v sém. sítích.
  • 5. Formální jazyky pro reprezentaci znalostí: RDF, OWL. Linked open data.
  • 6. Pravděpodobnostní modely.
  • 7. Word embeddings. Předtrénované modely.
  • 8. Analýza diskurzu, rozpoznávání anafor.
Literatura
    doporučená literatura
  • GODDARD, Cliff. Semantic Analysis : a practical introduction. Oxford: Oxford University Press, 1998, xv, 411 s. ISBN 0-19-870017-2. info
Výukové metody
Přednáška, výukové materiály v ISu (prezentace, videa). Cvičení na počítači, nejčastěji formou Jupyter Notebooku v prostředí Colab (není nutná žádná instalace software).
Metody hodnocení
Prezentace aktuálního vědeckého článku nebo aktuálního tématu z oblasti (podle vlastního výběru).
Informace učitele
Studijní literatura a studijní pomůcky:
J. ALLEN: Natural Language Understanding, 2nd. ed. Benjamin-Cummings Publishing Co., Inc., 1995.
CH. FELLBAUM: WordNet: An Electronic Lexical Database (Language, Speech, and Communication), The MIT Press, May 1998.
C. J. FILLMORE: The Case for Case, The Ohio State University, 1967.
K. K. SCHULER: VerbNet: A Broad-Coverage, Comprehensive Verb Lexicon, PhD Thesis, Faculties of the University of Pennsylvania, 2005.
N. SHADBOLT, W. HALL, T. BERNERS-LEE: The Semantic Web Revisited. IEEE Intelligent Systems, 2006. http://eprints.ecs.soton.ac.uk/12614/1/Semantic_Web_Revisted.pdf
https://www.deeplearning.ai/resources/natural-language-processing/
Prezentace z minulých let
https://nlp.fi.muni.cz/cs/OCemSeMluvi
Další komentáře
Výuka probíhá každý týden.
Předmět je zařazen také v obdobích podzim 2013, jaro 2014, podzim 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2021, jaro 2022, jaro 2023, jaro 2024.