C 2009

Czech Vulgarisms in Text Corpora

KOVÁŘ, Vojtěch, Miloš JAKUBÍČEK a Jan BUŠTA

Základní údaje

Originální název

Czech Vulgarisms in Text Corpora

Název česky

České vulgarismy v textových korpusech

Autoři

KOVÁŘ, Vojtěch (203 Česká republika, garant), Miloš JAKUBÍČEK (203 Česká republika) a Jan BUŠTA (203 Česká republika)

Vydání

1. vyd. Brno, After Half a Century of Slavonic Natural Language Processing, od s. 141-145, 5 s. 2009

Nakladatel

Tribun EU s.r.o.

Další údaje

Jazyk

angličtina

Typ výsledku

Kapitola resp. kapitoly v odborné knize

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/09:00036704

Organizační jednotka

Fakulta informatiky

ISBN

978-80-7399-815-8

Klíčová slova česky

vulgarismus; textový korpus;

Klíčová slova anglicky

vulgarism; text corpus

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 20. 10. 2010 13:06, RNDr. Miloš Jakubíček, Ph.D.

Anotace

V originále

Článek se zaměřuje na výskyt českých vulgarismů v textových korpusech, podává základní frekvenční charakteristiky z Českého národního korpusu a nově vytvořeného webového korpusu vulgarismů. Na základě těchto výsledků je dále diskutováno použití vulgarismů.

Česky

This paper focuses on the occurrence of vulgarisms in common Czech texts. We present frequencies of vulgarisms found in the Czech National Corpus and a web corpus of vulgarisms that has been newly created. Based on these data, usage of vulgarisms is then further discussed.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky