CJBB75 Základy využití korpusů (pro praxi)

Filozofická fakulta
jaro 2019
Rozsah
0/2/0. 4 kr. Ukončení: z.
Vyučující
doc. PhDr. Klára Osolsobě, Dr. (přednášející)
Garance
doc. PhDr. Klára Osolsobě, Dr.
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: Jaroslava Vybíralová
Dodavatelské pracoviště: Ústav českého jazyka – Filozofická fakulta
Rozvrh
St 10:00–11:40 G13
Předpoklady
Předpokladem pro přihlášení do kurzu je úspěšné ukončení předmětu CJA001 Úvod do studia českého jazyka nebo univerzitního kurzu pokrývajícího úvod do studia jazyka a jazykovědy
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 20 stud.
Momentální stav registrace a zápisu: zapsáno: 0/20, pouze zareg.: 0/20, pouze zareg. s předností (mateřské obory): 0/20
Jiné omezení: Předmět je povinný pro studenty Č. jazyka se specializací počítač. lingvistika, tito dostávají při zápisu přednost.
Mateřské obory/plány
Cíle předmětu
Cílem semináře je získání základních dovedností pro práci s jazykovými korpusy.
Výstupy z učení
Student bude schopen pracovat s jazykovým korpusem na základní úrovni. Student bude schopen formulovat dotazy v jazyce cql. Student bude schopen na základě pozorování dat získaných z korpusu formulovat tvrzení o jazyce.
Osnova
  • 1. Základní seznámení s korpusovým manažerem KonText, získání přístupových práv ke korpusům ČNK. 2. Charakteristika dostupných korpusů. 3. Hledání v korpusu podle volitelných atributů. 4. Morfologické značkování a lemmatizace. 5. Využití třídění a statistik. 6. Pozorování korpusových dat a jejich porovnání s gramatickými poučkami. 7. Samostatné řešení zadaných úkolů a jejich prezentace: vyhledávání v korpusech podle lemmatu/tagu a bez pomoci lemmatizace/morfologické anotace. 8. Samostatné řešení zadaných úkolů a jejich prezentace: vyhledávání podkladů pro analýzu problému z formální morfologie. 9. Samostatné řešení zadaných úkolů a jejich prezentace: vyhledávání podkladů pro analýzu problému ze slovotvorby. 10. Samostatné řešení zadaných úkolů a jejich prezentace: vyhledávání podkladů pro porovnání slovníkových definic a korpusové analýzy významu slov užitých v korpusových textech. 11. Samostatné řešení zadaných úkolů a jejich prezentace: vyhledávání podkladů pro formulaci distribučních pravidel variant. 12. Dedukce formálních vlastností přirozeného jazyka na základě pozorování korpusových dat.
Literatura
  • ŠULC, Michal. Korpusová lingvistika : první vstup. 1. vyd. Praha: Karolinum, 1999, 94 s. ISBN 8071848476. info
  • Jak využívat Český národní korpus. Edited by František Čermák - Renata Blatná. Vydání první. Praha: NLN, Nakladatelství Lidové noviny, 2005, 181 stran. ISBN 8071067369. info
  • Český národní korpus :úvod a příručka uživatele. Edited by Jan Kocek - Marie Kopřivová - Karel Kučera. Vyd. 1. Praha: Filozofická fakulta UK - Ústav Českého národního korpusu, 2000, 156 s. ISBN 80-85899-94-9. info
Výukové metody
Na praktický úvod (dostupné korpusy a korpusové manažery) naváží modelová cvičení, domácí úkoly, prezentace a diskuse.
Metody hodnocení
Závěrečný skupinový projekt: samostatné řešení zadaných úkolů a jejich prezentace. Během kurzu každý student vypracuje písemně (1-3 strany) 5 úkolů. Jeden úkol bude zpracován ve formě prezentace (10 minut).
Navazující předměty
Další komentáře
Studijní materiály
Předmět je vyučován každý semestr.
Před návštěvou CJBB75 je doporučeno absolvovat CJBB105 // oba předměty navštěvovat současně.
Předmět je zařazen také v obdobích jaro 2004, podzim 2004, jaro 2005, jaro 2006, podzim 2006, jaro 2007, podzim 2007, jaro 2008, podzim 2008, jaro 2009, podzim 2009, jaro 2010, podzim 2010, jaro 2011, podzim 2011, jaro 2012, podzim 2012, jaro 2013, jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, podzim 2018, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.