PA153 Počítačové zpracování přirozeného jazyka

Fakulta informatiky
podzim 2006
Rozsah
2/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
Vyučující
prof. PhDr. Karel Pala, CSc. (přednášející)
Garance
prof. Ing. Václav Přenosil, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: prof. PhDr. Karel Pala, CSc.
Rozvrh
Čt 10:00–11:50 B411
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 10 mateřských oborů, zobrazit
Cíle předmětu
Předmět nabízí seznámení s počítačovým zpracováním přirozeného jazyka na jednotlivých rovinách: morfologické, syntaktické, sémantické a pragmatické. Na každé rovině se probírají teoretická východiska a používané algoritmické popisy a nástroje a také jejich organizace do složitějších systémů.
Osnova
  • Roviny analýzy jazyka. Reprezentace a porozumění. Jazyková data - korpusy. Typy korpusů. Korpusové nástroje. Značkování korpusových textů. Desambiguace. Reprezentace morfologických struktur, notace, morfologické algoritmy. Reprezentace syntaktických struktur - formální gramatiky, jejich typy. Nekontextové gramatiky a DC gramatiky. Algoritmy syntaktické analýzy. Valenční rámce a typy valencí. Povrchové a hloubkové pády. Reprezentace významu. Lexikální významy (slova a slovní spojení), elektronické slovníky. Lexikální databáze, WordNet, EuroWordNet. Sémantické reprezentace vět. Sémantická analýza vět přirozeného jazyka s použitím transparentní intenzionální logiky. Nástin normálního translačního algoritmu. Pragmatika. Analýza promluvy, segmentace promluvy, anaforické vztahy a vztahy reference. Dialogové systémy a inference v přir. jazyce. Komunikační agenti.
Literatura
  • ALLEN, James. Natural language understanding. 2nd ed. Redwood City: Benjamin/Cummings Publishing Company, 1995, xv, 654 s. ISBN 0-8053-0334-0. info
  • CHOMSKY, Noam. Syntaktické struktury. gramatické pravidlo. Praha: Academia, 1966, 209 s. URL info
Další komentáře
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2002, podzim 2003, podzim 2004, podzim 2005, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2019, podzim 2020, podzim 2021, podzim 2022, podzim 2023.