FI:PA154 Nástroje pro korpusy - Informace o předmětu
PA154 Nástroje pro korpusy
Fakulta informatikyjaro 2004
- Rozsah
- 2/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- prof. PhDr. Karel Pala, CSc. (přednášející)
- Garance
- prof. PhDr. Karel Pala, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: prof. PhDr. Karel Pala, CSc. - Rozvrh
- Út 18:00–19:50 B204
- Omezení zápisu do předmětu
- Předmět je určen pouze studentům mateřských oborů.
- Mateřské obory/plány
- předmět má 8 mateřských oborů, zobrazit
- Cíle předmětu
- Předmět představuje úvod do korpusové lingvistiky a počítačové lexikografie. Lze v něm získat základní informace o typech korpusů, korpusových nástrojů, o značkování and disambiguation. V části věnované počítačové lexikografii je možno seznámit se s elektronickými slovníky a lexikálními databázemi a principy jejich budování.
- Osnova
- Textové korpusy a jejich typy. Standardizace korpusových dat - SGML, XML. Tvorba korpusů. Korpusové manažery a procesory (CQP, Manatee), grafická rozhraní (GCQP, Bonito), konkordanční programy (OCP). Značkování a značkovací nástroje (ajka). Morfologické, syntaktické a sémantické značkování (WSD). Desambiguace a desambiguátory (DIS aj., pravidlové, stochastické). Paralelní korpusy, zarovnávání a zarovnávače. Práce s korpusy, využití korpusových při budování slovníkü. Rozpoznávání významů slov v korpusových datech. Nástroje pro počítačovou lexikografii. Elektronické slovníky a jejich typy. Prohlížeče a editory pro elektronické slovníky. Lexikografická pracovní stanice. Lexikální databáze typu WordNet a EuroWordNet. Nástroje: Polaris, VisDic.
- Literatura
- Další komentáře
- Předmět je vyučován každoročně.
- Statistika zápisu (jaro 2004, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/jaro2004/PA154