IB030 Úvod do počítačové lingvistiky

Fakulta informatiky
podzim 2005
Rozsah
2/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučující
doc. RNDr. Aleš Horák, Ph.D. (přednášející)
Garance
prof. Ing. Václav Přenosil, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Aleš Horák, Ph.D.
Rozvrh
St 12:00–13:50 B204
Předpoklady
! I030 Úvod do počítač. lingv.
Před IB030 doporučuji zapsat PV122 Formální struktura přirozeného jazyka. Vhodná je znalost Prologu.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Předmět představuje úvod do počítačového zpracování přirozeného jazyka. Studenti se v něm seznámí s algoritmickým popisem jednotlivých jazykových rovin: morfologické, syntaktické, sémantické a pragmatické, a se zdroji jazykových dat: korpusy. Pozornost je věnována také reprezentaci znalostí, inferenci a vztahům k umělé inteligenci.
Osnova
  • Východiska počítačového zpracování přirozeného jazyka.
  • Přirozený jazyk jako hlavní nástroj lidské komunikace. Jazyková data v korpusech.
  • Roviny: fonetika, fonologie, morfologie, syntax, sémantika, pragmatika. Klasické a formální gramatiky: reprezentace morfologických a syntaktických struktur, reprezentace významu, gramatiky: nekontextové, kontextové, logické -- DCG, transformační, Analýza a syntéza: morfologická, syntaktická, sémantická, Analyzátory: morfologický -- AJKA, syntaktický -- KLARA, Strategie analýzy: shora, zdola, smíšené, heuristiky. Problém víceznačnosti a prohledávání.
  • Počítačové slovníky: reprezentace znalostí o lexikálních jednotkách. Typy elektronických slovníků: výkladové, thesaury, frazeologické, slovníky kmenů, překladové -- vícejazyčné, jejich formalizace.
  • Reprezentace významu věty: logická vs. lexikální sémantika, Princip kompozicionality: skládání významů. Sémantické klasifikace: valenční rámce, predikáty, ontologie, transparentní intenzionální logika a její aplikace na analýzu významů vět přirozeného jazyka.
  • Pragmatika: sémantická a pragmatická povaha jmenných skupin, struktura promluvy, deiktické výrazy, kontexty. Porozumění jazyku: význam, inference a reprezentace znalostí.
Literatura
  • PALA, Karel. Počítačové zpracování přirozeného jazyka. 1. vyd. Brno: FI MU, 2000, 190 s. info
  • ALLEN, James. Natural Language Understanding. 2nd ed. Redwood City: Benjamin/Cummings Publishing Company, 1995, xv, 654 s. ISBN 0-8053-0334-0. info
  • The Oxford handbook of computational linguistics. Edited by Ruslan Mitkov. Oxford: Oxford University Press, 2003, xx, 784. ISBN 0198238827. info
  • CHOMSKY, Noam. Syntaktické struktury., Logický základ teorie jazyka., O pojmu gramatické pravidlo. 1. vyd. Praha: Academia, 1966, 209 s. info
  • MATERNA, Pavel a Jan ŠTĚPÁN. Filozofická logika: nová cesta? Olomouc: Olomouc (Univerzita Palackého), 2000, 127 s. ISBN 80-244-0109-6. info
Metody hodnocení
Závěrečné hodnocení se děje na základě písemné zkoušky. Účast na přednáškách není povinná.
Informace učitele
http://nlp.fi.muni.cz/poc_lingv/
Další komentáře
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2002, podzim 2003, podzim 2004, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011, jaro 2012, jaro 2013, jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.