Závěrečná práce: Bc. Michal Cukr: Český korpus příkladových vět
Diplomová práce
Český korpus příkladových vět
Czech corpus of example sentences
Anotace
Cílem této práce bylo vytvoření českého textového korpusu příkladových vět pro speciální jazykově-výukové rozhraní SkELL. Jako zdroj textů jsme stáhli internetové domény a stránky zařazené do výběrových sklizní českého Webarchivu a dále českou Wikipedii včetně diskusí. Třetím zdrojem dat byla část korpusu novinek JSI. Stažené texty byly zpracovány nástroji pro korpusové zpracování a konečná textová …více
Abstract
The purpose of this work was creating a Czech text corpus of sentence examples for a special language-learning interface SkELL. As source texts, we downloaded websites chosen for selective harvests by Czech Webarchiv and Czech Wikipedia including discussion. The third source is a part of JSI Newsfeed Corpus. Crawled texts were prepared by tools for corpus processing and the final text collection was …více
Zadání práce
Cílem práce je získat a zpracovat data pro vytvoření českého textového korpusu CzSkELL, obdoby anglického korpusu SkELL. Ten slouží jako pomůcka při výuce angličtiny a byl vytvořen z volně dostupných internetových zdrojů. CzSkELL bude taktéž vytvořen na základě internetových zdrojů. Pro dosažení minimální kvality textů budou použity webové stránky, které archivuje Národní knihovna v rámci projektu Webarchiv.
Následně budou tyto stránky staženy, převedeny do čistého textu, zpracovány běžnými nástroji pro tvorbu korpusových dat, vyčištěny; věty budou seřazeny podle speciálního GDEX (Good Dictionary EXamples) skóre, indexovány a korpus bude vystaven v univerzitní instalaci korpusového nástroje Sketch Engine dostupném na adrese ske.fi.muni.cz.
23. 5. 2017 06:23, Mgr. et Mgr. Vít Baisa, Ph.D., učo 139654
Přílohy
Konzultant
Literatura
- BAISA, Vít a Vít SUCHOMEL. SkELL: Web Interface for English Language Learning. In Eighth Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2014, s. 63-70. ISSN 2336-4289.
- THOMAS, James Edward; Adam KILGARIFF; Simon SMITH a Fredrik MARCOWITZ. Corpora and Language Learning with the Sketch Engine and SKELL. Revue Française de Linguistique Appliquée. Paris: Publications linguistiques, 2015, roč. 20, č. 1, s. 61-80. ISSN 1386-1204.
Práce na příbuzné téma
Seznam prací, které mají shodná klíčová slova.
-
Analýza skloňování nesklonných slov
Mgr. Michal Cukr -
Tvorba uživatelského manuálu pro Sketch Engine
Bc. Nikola Petříková -
Názvy zvířecích druhů a jejich zástupců: vzorce a jejich frekvence
Mgr. Lucie Findejsová -
On Cognitive Synonymy: A Case Study (Soft and Mild)
Mgr. Daniela Vranovská, učo 110360 -
Adaptations phonologiques des arabismes dans le français parlé et leur variabilité graphique dans les corpus
Bc. Markéta Šumberová -
Zpracování fotografické terminologie: od korpusu k online slovníku
Bc. Veronika Vejmolová -
La lexicografía hispano-checa en el siglo XX
Mgr. Ing. Lenka Kaličiaková -
Tvorba hesel česko-německého lingvistického slovníčku
Mgr. et Mgr. Veronika Oškerová, Ph.D., učo 134438




