CJBB43 Introduction into Corpus Linguistics, Pt. I

Faculty of Arts
Autumn 1998
Extent and Intensity
2/0/0. 3 credit(s). Type of Completion: k (colloquium).
Teacher(s)
doc. PhDr. Klára Osolsobě, Dr. (lecturer)
Guaranteed by
doc. PhDr. Klára Osolsobě, Dr.
Department of Czech Language – Faculty of Arts
Contact Person: Jaroslava Vybíralová
Course Enrolment Limitations
The course is also offered to the students of the fields other than those the course is directly associated with.
fields of study / plans the course is directly associated with
Syllabus (in Czech)
  • 1. Informační technologie a jazykové korpusy. 2. Vznik korpusové lingvistiky a k čemu jsou korpusy. 3. Budování korpusů, korpusová data - typy korpusů a standardizace, SGML, TEI - sběr dat pro korpusy a reprezentativnost korpusů - údržba korpusů - příklady - Britský národní korpus, Český národní korpus (ČNK) 4. Korpusové nástroje - manažery - korpusový administrátor (CQP, CUE) - programy pro tvorbu konkordancí (KWIC) - OCP, LEXA, WORDCRUNCHER, PAT - využití regulárních výrazů - statistické programy (absolutní, relativní četnosti, M/I, T-score) - třídicí programy pro konkordance - konverzní programy mezi různými kódy - práce s atributy a značkami (tagy) 5. Anotované korpusy a značkování - základní úroveň značkování - metastruktura textu - SGML - gramatické značkování na úrovni slovních druhů (CLAWS, CUTTING Tagger, LEMMA) - syntaktické značkování na úrovni větných struktur - treebanks, skeletonová analýza - paralelní korpusy 6. Využití korpusů a korpusových dat - ukázky práce s korpusem - ČNK - studium kolokací a slovních spojení - aplikace v oblasti teorie komunikace - budování slovníků.
Literature
  • CHRIST, O., The XKWIC User Manual. Universität Stuttgart. Institut für maschinelle Sprachverarbeitung � Computerlinguistik. Stuttgart 1995.
  • Manuál lexikografie. Online. Edited by František Čermák - Renata Blatná. 1. vyd. Jinočany: H & H, 1995. 283 s. ISBN 80-85787-23-7. [citováno 2024-04-24] info
Assessment methods (in Czech)
Podmínkou pro udělení kolokvia je znalost probrané látky.
Language of instruction
Czech
Follow-Up Courses
Further comments (probably available only in Czech)
The course is taught: every week.
General note: Na přednášku navazuje v dalším semestru Úvod do korpusové lingvistiky II (CJBB23).
The course is also listed under the following terms Autumn 1999, Autumn 2000, Autumn 2001.
  • Enrolment Statistics (Autumn 1998, recent)
  • Permalink: https://is.muni.cz/course/phil/autumn1998/CJBB43