D 2020

RapCor, Francophone Rap Songs Text Corpus

PODHORNÁ-POLICKÁ, Alena

Basic information

Original name

RapCor, Francophone Rap Songs Text Corpus

Name in Czech

RapCor, frankofonní korpus textů rapových písní

Authors

PODHORNÁ-POLICKÁ, Alena (203 Czech Republic, guarantor, belonging to the institution)

Edition

1. vyd. Brno, Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2020, p. 95-102, 8 pp. 2020

Publisher

Tribun EU

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

60202 Specific languages

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

printed version "print"

References:

RIV identification code

RIV/00216224:14210/20:00117499

Organization unit

Faculty of Arts

ISBN

978-80-263-1600-8

ISSN

UT WoS

000655471300010

Keywords in English

French; text processing; rap music; hip hop; lyrics; substandard; neology; written orality; corpus building

Tags

International impact, Reviewed
Změněno: 1/2/2022 00:05, doc. PhDr. Alena Němcová Polická, Ph.D.

Abstract

V originále

The paper introduces the RapCor corpus, which is a specific text corpus for French, based on francophone rap songs’ texts from the last three decades when rap music became one of most popular music genres. An overview of more than ten years of rap corpora building presents our motivations, text processing methods, annotation decisions, as well as achievements and problematic issues. The published part of rap corpora, available in Sketch Engine manager for interdisciplinary research, the RapCor 1288, consists of 709,057 words of 1288 francophone rappers’ texts. It had been used mainly for the detection and longitudinal observation of so-called “identitary neologisms”, i.e. expressions emerging from communication between peers, motivated by search for group belonging, playfulness and expressivity. Rappers’ language is also a valuable resource for investigating metaphors and idioms that have been formed by assigning a new meaning to existing language items. The main goal of this largely substandard linguistic corpora is to uncover the phonemic and semantic innovations and trends in modern French.

In Czech

Článek představuje rapový korpus RapCor, což je specifický textový korpus pro francouzštinu, založený na textech frankofonních rapových písní z posledních tří desetiletí, kdy se rap stal jedním z nejpopulárnějších hudebních žánrů. Ve shrnutí více než desetiletého budování rapového korpusu jsou představeny hlavní motivace, metody zpracování textu, rozhodovací procesy při anotaci, ale i dosažené úspěchy a problematická témata. Publikovaná část korpusu pro mezioborový výzkum je dostupná skrze korpusový manažer Sketch Engine, kde je označena jako RapCor 1288 (skládá se totiž z 1288 textů, 709 057 slov, frankofonních raperů). Lze jej využít především k detekci a pozorování difúze takzvaných „identitárních neologismů“, tj. výrazů vycházejících z komunikace mezi vrstevníky, motivovaných hledáním příslušnosti ke skupině, hravostí a expresivitou. Jazyk rapu je také cenným zdrojem pro zkoumání metafor a resemantizovaných výrazů. Hlavním cílem tohoto jazykového korpusu převážně substandardní francouzštiny je možnost pozorování fonemických a sémantických inovací a trendů v moderní francouzštině.

Links

MUNI/A/1262/2019, interní kód MU
Name: Románské jazyky a románské literatury 2020 (Acronym: ROMJAZLIT20)
Investor: Masaryk University, Category A

Files attached