Diplomová práce

Český korpus příkladových vět

Czech corpus of example sentences

Bc. Michal Cukr
Anotace

Cílem této práce bylo vytvoření českého textového korpusu příkladových vět pro speciální jazykově-výukové rozhraní SkELL. Jako zdroj textů jsme stáhli internetové domény a stránky zařazené do výběrových sklizní českého Webarchivu a dále českou Wikipedii včetně diskusí. Třetím zdrojem dat byla část korpusu novinek JSI. Stažené texty byly zpracovány nástroji pro korpusové zpracování a konečná textová …více

Abstract

The purpose of this work was creating a Czech text corpus of sentence examples for a special language-learning interface SkELL. As source texts, we downloaded websites chosen for selective harvests by Czech Webarchiv and Czech Wikipedia including discussion. The third source is a part of JSI Newsfeed Corpus. Crawled texts were prepared by tools for corpus processing and the final text collection was …více

Zadání práce

Cílem práce je získat a zpracovat data pro vytvoření českého textového korpusu CzSkELL, obdoby anglického korpusu SkELL. Ten slouží jako pomůcka při výuce angličtiny a byl vytvořen z volně dostupných internetových zdrojů. CzSkELL bude taktéž vytvořen na základě internetových zdrojů. Pro dosažení minimální kvality textů budou použity webové stránky, které archivuje Národní knihovna v rámci projektu Webarchiv.

Následně budou tyto stránky staženy, převedeny do čistého textu, zpracovány běžnými nástroji pro tvorbu korpusových dat, vyčištěny; věty budou seřazeny podle speciálního GDEX (Good Dictionary EXamples) skóre, indexovány a korpus bude vystaven v univerzitní instalaci korpusového nástroje Sketch Engine dostupném na adrese ske.fi.muni.cz.

Práce zkontrolována:
23. 5. 2017 06:23, Mgr. et Mgr. Vít Baisa, Ph.D., učo 139654
Jazyk práce
čeština čeština
Termín obhajoby
9. 6. 2017
Práce byla úspěšně obhájena

Vedoucí

Mgr. et Mgr. Vít Baisa, Ph.D., učo 139654
ÚČJ FF MU

Oponent

RNDr. Zuzana Nevěřilová, Ph.D., učo 3839
ÚČJ FF MU

Konzultant

RNDr. Ondřej Herman, učo 255821
ÚČJ FF MU

Literatura

  • BAISA, Vít a Vít SUCHOMEL. SkELL: Web Interface for English Language Learning. In Eighth Workshop on Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2014, s. 63-70. ISSN 2336-4289.
  • THOMAS, James Edward; Adam KILGARIFF; Simon SMITH a Fredrik MARCOWITZ. Corpora and Language Learning with the Sketch Engine and SKELL. Revue Française de Linguistique Appliquée. Paris: Publications linguistiques, 2015, roč. 20, č. 1, s. 61-80. ISSN 1386-1204.

  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.