D 2020

RapCor, Francophone Rap Songs Text Corpus

PODHORNÁ-POLICKÁ, Alena

Základní údaje

Originální název

RapCor, Francophone Rap Songs Text Corpus

Název česky

RapCor, frankofonní korpus textů rapových písní

Autoři

PODHORNÁ-POLICKÁ, Alena (203 Česká republika, garant, domácí)

Vydání

1. vyd. Brno, Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2020, od s. 95-102, 8 s. 2020

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60202 Specific languages

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Kód RIV

RIV/00216224:14210/20:00117499

Organizační jednotka

Filozofická fakulta

ISBN

978-80-263-1600-8

ISSN

UT WoS

000655471300010

Klíčová slova anglicky

French; text processing; rap music; hip hop; lyrics; substandard; neology; written orality; corpus building

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 1. 2. 2022 00:05, doc. PhDr. Alena Němcová Polická, Ph.D.

Anotace

V originále

The paper introduces the RapCor corpus, which is a specific text corpus for French, based on francophone rap songs’ texts from the last three decades when rap music became one of most popular music genres. An overview of more than ten years of rap corpora building presents our motivations, text processing methods, annotation decisions, as well as achievements and problematic issues. The published part of rap corpora, available in Sketch Engine manager for interdisciplinary research, the RapCor 1288, consists of 709,057 words of 1288 francophone rappers’ texts. It had been used mainly for the detection and longitudinal observation of so-called “identitary neologisms”, i.e. expressions emerging from communication between peers, motivated by search for group belonging, playfulness and expressivity. Rappers’ language is also a valuable resource for investigating metaphors and idioms that have been formed by assigning a new meaning to existing language items. The main goal of this largely substandard linguistic corpora is to uncover the phonemic and semantic innovations and trends in modern French.

Česky

Článek představuje rapový korpus RapCor, což je specifický textový korpus pro francouzštinu, založený na textech frankofonních rapových písní z posledních tří desetiletí, kdy se rap stal jedním z nejpopulárnějších hudebních žánrů. Ve shrnutí více než desetiletého budování rapového korpusu jsou představeny hlavní motivace, metody zpracování textu, rozhodovací procesy při anotaci, ale i dosažené úspěchy a problematická témata. Publikovaná část korpusu pro mezioborový výzkum je dostupná skrze korpusový manažer Sketch Engine, kde je označena jako RapCor 1288 (skládá se totiž z 1288 textů, 709 057 slov, frankofonních raperů). Lze jej využít především k detekci a pozorování difúze takzvaných „identitárních neologismů“, tj. výrazů vycházejících z komunikace mezi vrstevníky, motivovaných hledáním příslušnosti ke skupině, hravostí a expresivitou. Jazyk rapu je také cenným zdrojem pro zkoumání metafor a resemantizovaných výrazů. Hlavním cílem tohoto jazykového korpusu převážně substandardní francouzštiny je možnost pozorování fonemických a sémantických inovací a trendů v moderní francouzštině.

Návaznosti

MUNI/A/1262/2019, interní kód MU
Název: Románské jazyky a románské literatury 2020 (Akronym: ROMJAZLIT20)
Investor: Masarykova univerzita, Románské jazyky a románské literatury 2020, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty

Přiložené soubory