PLIN032 Gramatika a korpus

Filozofická fakulta
podzim 2022
Rozsah
0/2/0. 5 kr. Ukončení: zk.
Vyučující
doc. PhDr. Klára Osolsobě, Dr. (přednášející)
Garance
doc. PhDr. Klára Osolsobě, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
Po 10:00–11:40 G13
Předpoklady
Předpokladem přijetí do semináře je absolvování kurzu CJBB75.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Cílem kurzu (volně navazujícího na výběrový kurz bakalářského studia CJBB75) je naučit studenty používat jazykové korpusy jakožto zdroje observací fungování přirozeného jazyka (češtiny).
Výstupy z učení
Student bude schopen:
- najít v korpusu data relevantní pro řešení zadaného úkolu;
- užívat korpusové nástroje;
- formulovat generalizace opřené o data získaná z korpusu.
Osnova
  • 1. Jak lze v korpusech hledat doklady pro výzkum hláskových alternací v rámci substantivní flexe?
  • 2. Další samohláskové alternace v české substantivní flexi.
  • 3. Varianty a dublety – korpusy jako zdroje dat pro formulaci pravidel distribuce variantních spisovných koncovek v české substantivní flexi.
  • 4. Varianty a dublety – korpusy jako zdroje dat pro formulaci pravidel distribuce variantních spisovných koncovek v české slovesné flexi.
  • 5. Vlastnosti adjektiv zakončených na -cí.
  • 6. Slovnědruhové přesahy.
  • 7. Syntetické futurum v češtině.
  • 8. Příslovečné spřežky.
  • 9. Ještě jednou k adjektivům zakončeným na –cí.
  • 10. Víceslovné výrazy (Multiword Expression).
Literatura
    povinná literatura
  • OSOLSOBĚ, Klára. Česká morfologie a korpusy. Vyd. 1. Praha: Karolinum, 2014, 236 s. ISBN 978-80-246-2562-1. URL info
    doporučená literatura
  • ČERMÁK, F. - BLATNÁ, R. (EDS.): Korpusová lingvistika: Stav a modelové přístupy. Praha : Nakladatelství LN. 2006. JELÍNEK, T. Nové značkování v Českém národním korpusu. Naše řeč 91, 2008, 13–20.
Výukové metody
Prostředkem k vytyčenému cíli je soubor cvičení. Nejdříve si studenti pod vedením pedagoga osvojí metody při řešení zadaných problémů (vyhledávání dat, třídění dat, vyvozování závěrů na základě pozorování dat). Následně budou samostatně zpracovávat zadané úkoly, prezentovat je a diskutovat o nich. Jsou vyžadována cvičení, domácí úkoly, následná diskuze a projekt.
Metody hodnocení
Předmět je ukončen zkouškou. Závěrečná práce (5–10 stran).
Informace učitele
Studijní literatura: ČERMÁK, F. - BLATNÁ, R. (EDS.): Korpusová lingvistika: Stav a modelové přístupy. Praha : Nakladatelství LN. 2006. CVRČEK, V. A KOL.: Mluvnice souĉasné češtiny. Praha : Nakladatelství LN. 2010. DOKULIL, M.- KOMÁREK, M. A KOL.: Mluvnice ĉeńtiny I, II. Praha : Academia. 1986. HAJIČ J.: Desambiguation of Rich Inflection (Computational Morphology of Czech). Praha : Karolinum. 2004. JELÍNEK, T. Nové značkování v Českém národním korpusu. Naše řeč 91, 2008, 13–20. OSOLSOBĚ, K.: Korpus soukromé korespondence (KSK) z hlediska morfologického značkování. In SPFFBU, A 54, 185–199. Brno: MU. OSOLSOBĚ, K.: Popis gramatických významů (hodnot) jednoduchých slovesných tvarů v anotacích ĉeských (slovenských) korpusů. Linguistica Brunensia, Brno, Masarykova Univerzita. 2007, vol. A 55, no. 1, s. 201-218. PETKEVIČ, V. Reliable Morphological Desambiguation of Czech: Rule-Based Approach is Necessary. In Šimková, M. (ed.), Insight into the Slovak and Czech Corpus Linguistics, Bratislava : Veda. 2006. ŠIMANDL, J.: Dneńní skloňování substantiv typů kámen, břímě. Nakladatelství LN. Praha 2010. ŠTÍCHA,F. (ED.): Gramatika a korpus 2007. In Grammar & Corpora, sborník příspěvků ze stejnojmenné konference, 25.- 27.9.2007. Praha : Academia. 2008. ŠTÍCHA, F. (ED.): Možnosti a meze české gramatiky. Praha : Academia. 2006. Korpusový manažer NoSketch Engine dostupný z http://korpus.cz/corpora/ Morfologický analyzátor ajka dostupný z http://nlp.fi.muni.cz/projekty/wwwajka. http://ucnk.ff.cuni.cz DEBII — Dictionary Editor and Browser
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, podzim 2019, podzim 2020, podzim 2021, podzim 2023, podzim 2024.