PRZA009 Korpusová lingvistika

Filozofická fakulta
jaro 2021
Rozsah
0/2/0. 5 kr. Ukončení: zk.
Vyučující
Mgr. Dana Hlaváčková, Ph.D. (přednášející)
prof. PhDr. Iva Zündorf, Ph.D. (přednášející)
Garance
prof. PhDr. Iva Zündorf, Ph.D.
Filozofická fakulta
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Út 12:00–13:40 D31
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Přednáška má poskytnout základní orientaci v oboru korpusová lingvistika. Studenti jsou seznamováni s následujícími okruhy: 1) s historií korpusové lingvistiky, 2) s vymezením termínu jazykový korpus, 3) s oblastmi lingvistiky využívajícími jazykové korpusy (kvantitativní lingvistika, počítačová lingvistika), 4) s tzv. vytěžováním (mining) korpusu, 5) s anotacemi korpusu, 6) s korpusovými nástroji.
Výstupy z učení
Student získá základní přehled v oboru korpusová lingvistika, orientuje se v dějinách oboru, v jeho poli působnosti, v příslušné odborné terminologii, stejně jako v základních nástrojích a jejich využití.
Osnova
  • 1. Historie KL a historie KL v ČR (ÚČNK) 2. Korpus v moderním slova smyslu a budování korpusů 3. Dostupné korpusy a jejich stručná charakteristika 4. Automatická morfologická analýza (tokenizace, analýza a desambiguace, tagging a lemmatizace) 5. Praxe v českém prostředí 6. Mluvené korpusy 7. Korpus soukromé korespondence 8. Korpusové manažery 9. Kvantitativní data 10. Diachronie a korpusy
Literatura
  • http://ufal.mff.cuni.cz/pdt2.0/index-cz.html
  • Čermák, F.: Jazykový korpus: Prostředek a zdroj poznání. SaS, 56, 1995, s. 119-140.
  • Čermák F, Blatná R. (eds.) (1995): Manuál lexikografie. Jinočany : H&H.
  • Čermák František (1999): Oxfordská lexikografie přechází také plně na korpus. Slovo a slovesnost, 60, s. 136-141.
  • Čermák F., Králík J., Kučera K. (1997): Recepce současné češtiny a reprezentativnost korpusu (Výsledky a některé souvislosti jedné orientační sondy na pozadí budování Českého národního korpusu). SaS, 58, 2, s. 118-124.
  • http://ucnk.ff.cuni.cz/
  • Encyklopedický slovník češtiny. Edited by Petr Karlík - Marek Nekula - Jana Pleskalová. Praha: Nakladatelství Lidové noviny, 2002, 604 s. ISBN 80-7106-484-X. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
  • MCENERY, Tony a Andrew WILSON. Corpus linguistics. Edinburgh: Edinburgh University Press, 1996, 209 s. ISBN 0-7486-0482-0. info
  • BARNBROOK, Geoff. Language and computers :a practical introduction to the computer analysis of language. Edinburgh: Edinburgh University Press, 1996, ix, 209 s. ISBN 0-7486-0785-4. info
Výukové metody
Přednáška spojená s prezentací korpusů a korpusových manažerů. Samostatné studium doporučených textů.
Metody hodnocení
Kolokvium. Písemný test: zvládnutí základního pojmosloví oboru a problematiky na úrovni odpřednášené látky a textů zadaných ke studiu. Test obsahuje celkem 10 otázek (minimální počet bodů je 66,6 %).
Navazující předměty
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích jaro 2020, jaro 2022, jaro 2023, jaro 2024, jaro 2025.