2020
RapCor, Francophone Rap Songs Text Corpus
PODHORNÁ-POLICKÁ, AlenaZákladní údaje
Originální název
RapCor, Francophone Rap Songs Text Corpus
Název česky
RapCor, frankofonní korpus textů rapových písní
Autoři
PODHORNÁ-POLICKÁ, Alena (203 Česká republika, garant, domácí)
Vydání
1. vyd. Brno, Proceedings of the Fourteenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2020, od s. 95-102, 8 s. 2020
Nakladatel
Tribun EU
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
60202 Specific languages
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
tištěná verze "print"
Odkazy
Kód RIV
RIV/00216224:14210/20:00117499
Organizační jednotka
Filozofická fakulta
ISBN
978-80-263-1600-8
ISSN
UT WoS
000655471300010
Klíčová slova anglicky
French; text processing; rap music; hip hop; lyrics; substandard; neology; written orality; corpus building
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 1. 2. 2022 00:05, doc. PhDr. Alena Němcová Polická, Ph.D.
V originále
The paper introduces the RapCor corpus, which is a specific text corpus for French, based on francophone rap songs’ texts from the last three decades when rap music became one of most popular music genres. An overview of more than ten years of rap corpora building presents our motivations, text processing methods, annotation decisions, as well as achievements and problematic issues. The published part of rap corpora, available in Sketch Engine manager for interdisciplinary research, the RapCor 1288, consists of 709,057 words of 1288 francophone rappers’ texts. It had been used mainly for the detection and longitudinal observation of so-called “identitary neologisms”, i.e. expressions emerging from communication between peers, motivated by search for group belonging, playfulness and expressivity. Rappers’ language is also a valuable resource for investigating metaphors and idioms that have been formed by assigning a new meaning to existing language items. The main goal of this largely substandard linguistic corpora is to uncover the phonemic and semantic innovations and trends in modern French.
Česky
Článek představuje rapový korpus RapCor, což je specifický textový korpus pro francouzštinu, založený na textech frankofonních rapových písní z posledních tří desetiletí, kdy se rap stal jedním z nejpopulárnějších hudebních žánrů. Ve shrnutí více než desetiletého budování rapového korpusu jsou představeny hlavní motivace, metody zpracování textu, rozhodovací procesy při anotaci, ale i dosažené úspěchy a problematická témata. Publikovaná část korpusu pro mezioborový výzkum je dostupná skrze korpusový manažer Sketch Engine, kde je označena jako RapCor 1288 (skládá se totiž z 1288 textů, 709 057 slov, frankofonních raperů). Lze jej využít především k detekci a pozorování difúze takzvaných „identitárních neologismů“, tj. výrazů vycházejících z komunikace mezi vrstevníky, motivovaných hledáním příslušnosti ke skupině, hravostí a expresivitou. Jazyk rapu je také cenným zdrojem pro zkoumání metafor a resemantizovaných výrazů. Hlavním cílem tohoto jazykového korpusu převážně substandardní francouzštiny je možnost pozorování fonemických a sémantických inovací a trendů v moderní francouzštině.
Návaznosti
MUNI/A/1262/2019, interní kód MU |
|