D 2019

Benchmark Dataset for Propaganda Detection in Czech Newspaper Texts

HORÁK, Aleš, Vít BAISA a Ondřej HERMAN

Základní údaje

Originální název

Benchmark Dataset for Propaganda Detection in Czech Newspaper Texts

Autoři

HORÁK, Aleš (203 Česká republika, garant, domácí), Vít BAISA (203 Česká republika, domácí) a Ondřej HERMAN (203 Česká republika, domácí)

Vydání

Varna, Bulgaria, Proceedings of Recent Advances in Natural Language Processing, RANLP 2019, od s. 77-83, 7 s. 2019

Nakladatel

INCOMA Ltd.

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Bulharsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/19:00110579

Organizační jednotka

Fakulta informatiky

ISBN

978-954-452-055-7

ISSN

Klíčová slova anglicky

propaganda detection; manipulative techniques; benchmark dataset

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 3. 5. 2020 12:49, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Propaganda of various pressure groups ranging from big economies to ideological blocks is often presented in a form of objective newspaper texts. However, the real objectivity is here shaded with the support of imbalanced views and distorted attitudes by means of various manipulative stylistic techniques. In the project of Manipulative Propaganda Techniques in the Age of Internet, a new resource for automatic analysis of stylistic mechanisms for influencing the readers’ opinion is developed. In its current version, the resource consists of 7,494 newspaper articles from four selected Czech digital news servers annotated for the presence of specific manipulative techniques. In this paper, we present the current state of the annotations and describe the structure of the dataset in detail. We also offer an evaluation of bag-of-words classification algorithms for the annotated manipulative techniques.

Návaznosti

MUNI/A/1018/2018, interní kód MU
Název: Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII.
Investor: Masarykova univerzita, Rozsáhlé výpočetní systémy: modely, aplikace a verifikace VIII., DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
MUNI/G/0872/2016, interní kód MU
Název: Manipulativní techniky propagandy v době internetu
Investor: Masarykova univerzita, Manipulativní techniky propagandy v době internetu, INTERDISCIPLINARY - Mezioborové výzkumné projekty