PLIN019 Machine Translation

Filozofická fakulta
jaro 2016
Rozsah
0/2/0. 3 kr. Ukončení: z.
Vyučující
Mgr. et Mgr. Vít Baisa, Ph.D. (přednášející)
Garance
doc. PhDr. Zdeňka Hladká, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Mgr. et Mgr. Vít Baisa, Ph.D.
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Čt 10:50–12:25 G13
Předpoklady
Knowledge of basic terms and concepts from the realm of natural language processing.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 20 stud.
Momentální stav registrace a zápisu: zapsáno: 0/20, pouze zareg.: 0/20, pouze zareg. s předností (mateřské obory): 0/20
Mateřské obory/plány
Cíle předmětu
After passing the course, a student will a) be able to understand basic concepts and facts from machine translation, b) have knowledge of both historical and current trends in this area.
Osnova
  • Basic concepts and historical facts of machine translation (MT).
  • Methods of translation evaluation, general issues, the most important MT tools and systems.
  • 1. Basic concepts and progress of MT from 1940's
  • 2. Overview and basic classification of MT systems
  • 3. Rule-based methods I: from text to semantic representation
  • 4. Rule-based methods II: specific tasks and problems of RBMT
  • 5. Statistical methods I: theory of probability, theory of information
  • 6. Statistical methods II: word-based methods
  • 7. Statistical methods III: phrase-based methods
  • 8. Statistical methods IV: decoding algorithms
  • 9. Statistical methods V: language models
  • 10. Hybrid methods: combination of various methods
  • 11. Partial methods: computer-aided, human-aided methods, translational memories
  • 12. Automatic MT evaluation: concepts, overview of the most important methods
Literatura
    doporučená literatura
  • SOJKA, Petr, Aleš HORÁK, Karel PALA a Pavel RYCHLÝ. MTW 2012 -- Hybrid Machine Translation, Machine Translation Workshop, Brno, Czech Republic, September 3, 2012. Edited by Sojka P., Horák A., Kopeček I., Pala K. prvni. Brno: Tribun EU a Springer Verlag. 68 s. ISBN 978-80-263-0266-7. 2012. MTW 2012 workshop homepage info
  • BAISA, Vít. Problems of Machine Translation Evaluation. In Proceedings of Recent Advances in Slavonic Natural Language Processing 2009. Brno: Masaryk University. s. 121-126. ISBN 978-80-210-5048-8. 2009. URL info
  • Readings in machine translation. Edited by Sergei Nirenburg - H. L. Somers - Yorick A. Wilks. Cambridge, Mass.: MIT Press. xv, 413. ISBN 0262140748. 2003. info
  • Machine translation and translation theory. Edited by Christa Hauenschild - Heizmann Heizmann. Berlin: Mouton de Gruyter. xiv, 226. ISBN 3110154862. 2001. info
  • ARNOLD, Doug, Lorna BALKAN, Siety MEIJER, R. LEE HUMPHREYS a Louisa SADLER. Machine translation: an introductory guide. London: Blackwells/NCC. ISBN 18555-42-17X. 1994. URL info
  • STEINER, George. After Babel : aspects of language and translation. 2nd ed. Oxford: Oxford University Press. xviii, 538. ISBN 0-19-212300-9. 1992. info
  • HUTCHINS, W. John a Harold L. SOMERS. An introduction to machine translation. London: Academic Press. xxi, 362 s. ISBN 0-12-362830-X. 1992. info
  • HUTCHINS, W. John a Harold L. SOMERS. An introduction to machine translation. London: Academic Press. xxi, 362 s. ISBN 0-12-362830-X. 1992. info
  • The nature of translation : essays on the theory and practice of literary translation. The Hague: Mouton, 1970. info
Výukové metody
Seminar - lectures each week, cca 5-10 minutes for students' presentations (in English/Czech)
Metody hodnocení
Written test. In addition: during a semester, compulsory presentation about a) significant paper / book / publication from the realm of MT; b) significant MT system (+ basic evaluation, comparison with other selected systems) OR students can prepare an article to be published on Czech and English Wikipedia (its extent and other details will be arranged in due time).
Informace učitele
http://nlp.fi.muni.cz/~xbaisa/plin019/
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích jaro 2012, jaro 2013, jaro 2014, jaro 2015, jaro 2017, jaro 2018, jaro 2019.