CJc304 Základy korpusové lingvistiky

Pedagogická fakulta
podzim 2018
Rozsah
9 hodin. 2 kr. Ukončení: z.
Vyučující
Mgr. Hana Žižková, Ph.D. (přednášející)
Garance
doc. PhDr. Milena Šubrtová, Ph.D.
Katedra českého jazyka a literatury – Pedagogická fakulta
Kontaktní osoba: Petra Rozbořilová
Dodavatelské pracoviště: Katedra českého jazyka a literatury – Pedagogická fakulta
Rozvrh seminárních/paralelních skupin
CJc304/01: Pá 5. 10. 14:00–15:50 učebna 28, Pá 9. 11. 14:00–15:50 učebna 28, Pá 30. 11. 8:00–9:50 učebna 28, H. Žižková
Omezení zápisu do předmětu
Předmět je určen pouze studentům mateřských oborů.
Mateřské obory/plány
Cíle předmětu
Na konci kurzu je student schopen: 1. Prakticky užívat Český národní korpus; vyhledat v korpusu SYN2015 nejen jevy hláskové, tvaroslovné a lexikální, ale též sestavit složitější dotazy např. pro vyhledání syntaktických struktur.
2. Utřídit vyhledané jevy pomocí korpusových nástrojů a zpracovat je na základě lingvistických znalostí.
3. Zvolit vhodný postup vyhledávání jazykových jevů v ČNK při řešení konkrétního problému.
4. Vyhledat zvolený jev v korpusech mluvené češtiny.
Osnova
  • 1. Typy korpusů, reprezentativnost korpusů. KonText. Korpusy psané a mluvené češtiny.
  • 2. Vyhledávání vybraných tvaroslovných variant, obzvláště dublet. Posuzování jejich konkurence.
  • 3. Vyhledávání vybraných slov a sousloví. Frazeologie v českém národním korpusu.
  • 4. Konkurenty slovotvorné v Českém národním korpusu.
  • 5. Vytváření dotazů pro zjišťování zvolených syntaktických struktury v korpusu SYN2010. Kombinace dotazů a další nástrojů webového rozhraní (pozitivní a negativní filtr).
  • 6. Tvorba vlastních subkorpusů.
  • 7. Zhodnocení jazykových jevů nalezených v korpusu z různých hledisek.
Literatura
    doporučená literatura
  • ČERMÁK, František, Karel KUČERA a Vladimír PETKEVIČ. Korpusová lingvistika Praha 2011, 2 Výzkum a výstavba korpusů. Praha: Nakladatelství Lidové noviny, Ústav Českého národního korpusu, 2011. Studie z korpusové lingvistiky 15. ISBN 978-80-7422-115-6. info
  • ČERMÁK, František, Karel KUČERA, Vladimír PETKEVIČ a Alexander ROSEN. Korpusová lingvistika, Praha 2011. 3. Gramatika a značkování korpusů. Praha: Nakladatelství Lidové noviny, 2011, 225 s. Studie z korpusové lingvistiky 16. ISBN 978-80-7422-116-3. info
  • Grammar & Corpora 2007 :selected contributions from the conference Gramar and Corpora, Sept. 25-27, 2007, Liblice. Edited by František Štícha - Mirjam Fried. Vyd. 1. Praha: Academia, 2008, 443 s. ISBN 9788020016348. info
  • Studie z korpusové lingvistiky. Edited by František Čermák - Jana Klímová - Vladimír Petkevič. Vyd. 1. V Praze: Karolinum, 2000, 531 s. ISBN 807184893X. info
Výukové metody
Seminář - problémová metoda, řízený rozhovor o odborných problémech tohoto kurzu. Vyhledávání v Českém národním korpusu.
Analýza vyhledaných jazykových jevů.
Metody hodnocení
Podmínkou pro získání zápočtu je prokázání dovedností vyhledávat a zpracovávat jazykové jevy, které bude ověřeno testováním v závěrečném semináři. Studenti dostanou cca 10 úkolů zaměřených na vyhledání a zpracování vybraných jazykových jevů, z nichž musejí správně zvládnout minimálně 7. Předpokládá se též zpracovávání zadaných úkolů v průběhu semestru.
Informace učitele
http://wiki.korpus.cz/doku.php/manualy:kontext:index
Odkaz směruje uživatele na webový portál Ústavu českého národního korpusu FF UK v Praze. Na webových stránkách jsou vysvětleny základní termíny a poskytnuty návody pro práci s webovým rozhraním KonText.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2019, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.