SABOL, Radoslav a Aleš HORÁK. Manipulative Style Recognition of Czech News Texts using Stylometric Text Analysis. In Aleš Horák, Pavel Rychlý, Adam Rambousek. Proceedings of the Sixteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2022. Brno: Tribun EU, 2022, s. 189-197. ISBN 978-80-263-1752-4.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Manipulative Style Recognition of Czech News Texts using Stylometric Text Analysis
Autoři SABOL, Radoslav (703 Slovensko, garant, domácí) a Aleš HORÁK (203 Česká republika, domácí).
Vydání Brno, Proceedings of the Sixteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2022, od s. 189-197, 9 s. 2022.
Nakladatel Tribun EU
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání tištěná verze "print"
WWW Plný text Domovská stránka workshopu
Kód RIV RIV/00216224:14330/22:00127486
Organizační jednotka Fakulta informatiky
ISBN 978-80-263-1752-4
ISSN 2336-4289
Klíčová slova anglicky stylometry; propaganda detection; manipulative style analysis; Propaganda dataset; Czech
Změnil Změnila: Mgr. Jitka Nováčková, učo 444407. Změněno: 16. 12. 2022 17:25.
Anotace
The rampant spread of manipulative texts purporting propaganda, disinformation or surveillance, requires the readers to take heed of the actual reasoning behind and the real purpose of the newspaper texts. The capability to recognize a malignant content asks for more and more concentration and background knowledge. A support offered by automated content analysis tools forms an important part of such protective approaches. In the presented text, we introduce a new approach to detecting a set of manipulative stylistic techniques in Czech newspaper texts by exploiting stylometric methods in conjunction with deep learning text classification. We show that the stylometric analysis with almost 20,000 features allows to improve the results for most of the techniques. The results are evaluated with a previously published Czech Propaganda dataset.
Návaznosti
LM2018101, projekt VaVNázev: Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy (Akronym: LINDAT/CLARIAH-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, LINDAT/CLARIAH-CZ - Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědy
VytisknoutZobrazeno: 25. 4. 2024 10:44