LEWANDOWSKA-TOMASZCZYK, Barbara, Anna BĄCZKOWSKA, Olga DONTCHEVA-NAVRÁTILOVÁ, Chaya LIEBESKIND, Giedrė VALŪNAITĖ OLEŠKEVIČIENĖ, Slavko ŽITNIK, Marvin TROJSZCZAK, Renata POVOLNÁ, Linas SELMISTRAITIS, Andrius UTKA a Dangis GUDELIS. LLOD schema for Simplified Offensive Language Taxonomy in multilingual detection and applications. Lodz Papers in Pragmatics. Německo: De Gruyter, 2023, roč. 19, č. 2, s. 301-324. ISSN 1895-6106. Dostupné z: https://dx.doi.org/10.1515/lpp-2023-0016.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název LLOD schema for Simplified Offensive Language Taxonomy in multilingual detection and applications
Autoři LEWANDOWSKA-TOMASZCZYK, Barbara (616 Polsko), Anna BĄCZKOWSKA (616 Polsko), Olga DONTCHEVA-NAVRÁTILOVÁ (100 Bulharsko, garant, domácí), Chaya LIEBESKIND, Giedrė VALŪNAITĖ OLEŠKEVIČIENĖ (440 Litva), Slavko ŽITNIK (705 Slovinsko), Marvin TROJSZCZAK (616 Polsko), Renata POVOLNÁ (203 Česká republika, domácí), Linas SELMISTRAITIS (440 Litva), Andrius UTKA (440 Litva) a Dangis GUDELIS (440 Litva).
Vydání Lodz Papers in Pragmatics, Německo, De Gruyter, 2023, 1895-6106.
Další údaje
Originální jazyk angličtina
Typ výsledku Článek v odborném periodiku
Obor 60203 Linguistics
Stát vydavatele Německo
Utajení není předmětem státního či obchodního tajemství
WWW URL
Kód RIV RIV/00216224:14410/23:00133087
Organizační jednotka Pedagogická fakulta
Doi http://dx.doi.org/10.1515/lpp-2023-0016
Klíčová slova anglicky offensive language; offensive language taxonomy; annotation; LLOD; linguistic linked open data; hate speech
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnila: Mgr. Daniela Marcollová, učo 111148. Změněno: 25. 1. 2024 09:27.
Anotace
The goal of the paper is to present a Simplified Offensive Language (SOL) Taxonomy, its application and testing in the Second Annotation Campaign conducted between March-May 2023 on four languages: English, Czech, Lithuanian, and Polish to be verified and located in LLOD. Making reference to the previous Offensive Language taxonomic models proposed mostly by the same COST Action Nexus Linguarum WG 4.1.1 team, the number and variety of the categories underwent the definitional revision, and the present typology was tested in the annotation on the publicly available offensive language datasets of each of the four languages. The results of the annotation are presented and as they are contained within the accepted statistical values on the inter-annotator agreement in the SOL categories and their aspects, we propose this taxonomy as a core ontology which represents the encoding of the supported offensive languages and justify its use on new data in terms of a more universal Linguistic Linked Open Data (LLOD) schema.
VytisknoutZobrazeno: 25. 7. 2024 18:26