CJc304 Základy korpusové lingvistiky

Pedagogická fakulta
podzim 2022
Rozsah
6 hodin. 2 kr. Ukončení: z.
Vyučující
PhDr. Ivana Kolářová, CSc. (přednášející)
Garance
doc. PhDr. Milena Šubrtová, Ph.D.
Katedra českého jazyka a literatury – Pedagogická fakulta
Kontaktní osoba: Petra Rozbořilová
Dodavatelské pracoviště: Katedra českého jazyka a literatury – Pedagogická fakulta
Rozvrh seminárních/paralelních skupin
CJc304/01: Pá 16. 9. 16:00–18:50 učebna 72, Pá 4. 11. 15:00–17:50 učebna 25, I. Kolářová
Omezení zápisu do předmětu
Předmět je určen pouze studentům mateřských oborů.
Mateřské obory/plány
Cíle předmětu
Předmět je zaměřen na poznání základů práce s Českým národním korpusem a praktické využívání jeho nástrojů při vyhledávní jazykových jevů. Cílem je předat studentům takové praktické dovednosti, kterých mohou využít v pedagogické praxi.
Výstupy z učení
Na konci kurzu je student schopen: 1. Vyhledat v korpusu SYN2020 jevy hláskové, tvaroslovné a lexikální.
2. Utřídit vyhledané jevy pomocí korpusových nástrojů a zpracovat je na základě lingvistických znalostí.
3. Zvolit vhodný postup vyhledávání jazykových jevů v ČNK při řešení konkrétního problému.
Osnova
  • 1. Typy korpusů, reprezentativnost korpusů. KonText. Korpusy psané a mluvené češtiny.
  • 2. Vyhledávání vybraných tvaroslovných variant, obzvláště dublet. Posuzování jejich konkurence.
  • 3. Vyhledávání vybraných slov a sousloví. Frazeologie v českém národním korpusu.
  • 4. Konkurenty slovotvorné v Českém národním korpusu.
  • 5. Vytváření dotazů pro zjišťování zvolených syntaktických struktury v korpusu SYN2020. Kombinace dotazů a další nástrojů webového rozhraní (pozitivní a negativní filtr).
  • 6. Tvorba vlastních subkorpusů.
  • 7. Zhodnocení jazykových jevů nalezených v korpusu z různých hledisek.
Literatura
    doporučená literatura
  • ČERMÁK, František, Karel KUČERA a Vladimír PETKEVIČ. Korpusová lingvistika Praha 2011, 2 Výzkum a výstavba korpusů. Praha: Nakladatelství Lidové noviny, Ústav Českého národního korpusu, 2011. Studie z korpusové lingvistiky 15. ISBN 978-80-7422-115-6. info
  • ČERMÁK, František, Karel KUČERA, Vladimír PETKEVIČ a Alexander ROSEN. Korpusová lingvistika, Praha 2011. 3. Gramatika a značkování korpusů. Praha: Nakladatelství Lidové noviny, 2011, 225 s. Studie z korpusové lingvistiky 16. ISBN 978-80-7422-116-3. info
  • Grammar & Corpora 2007 :selected contributions from the conference Gramar and Corpora, Sept. 25-27, 2007, Liblice. Edited by František Štícha - Mirjam Fried. Vyd. 1. Praha: Academia, 2008, 443 s. ISBN 9788020016348. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
    neurčeno
  • OSOLSOBĚ, Klára. Česká morfologie a korpusy. Vyd. 1. Praha: Karolinum, 2014, 236 s. ISBN 978-80-246-2562-1. URL info
Výukové metody
Seminář - problémová metoda, řízený rozhovor o odborných problémech tohoto kurzu. Vyhledávání v Českém národním korpusu.
Analýza vyhledaných jazykových jevů.
Metody hodnocení
Podmínkou pro získání zápočtu je prokázání dovedností vyhledávat a zpracovávat jazykové jevy, které bude ověřeno v závěrečné seminární domácí práci. Studenti dostanou cca 6 úkolů zaměřených na vyhledání a zpracování vybraných jazykových jevů, které samostatně zpracují. Správně musejí mít alespoň 4 úkoly. Předpokládá se též zpracovávání zadaných úkolů v průběhu semestru.
Informace učitele
https://teams.microsoft.com/l/team/19%3a31a3e56fe5ce4cb5a38451561e5f4a2d%40thread.tacv2/conversations?groupId=17cfacf5-072f-42d3-99d1-fad4df2b4742&tenantId=11904f23-f0db-4cdc-96f7-390bd55fcee8
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2018, podzim 2019, podzim 2020, podzim 2021, podzim 2023, podzim 2024.