J 2019

Text-Based Detection of the Risk of Depression

HAVIGEROVÁ, Jana Marie, Jiří HAVIGER, Dalibor KUČERA a Petra HOFFMANNOVÁ

Základní údaje

Originální název

Text-Based Detection of the Risk of Depression

Název česky

Detekce rizika deprese na základě analýzy textu

Autoři

HAVIGEROVÁ, Jana Marie (203 Česká republika, garant, domácí), Jiří HAVIGER (203 Česká republika), Dalibor KUČERA (203 Česká republika) a Petra HOFFMANNOVÁ (203 Česká republika, domácí)

Vydání

Frontiers in Psychology, Lausanne, Frontiers Media SA, 2019, 1664-1078

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

50101 Psychology

Stát vydavatele

Švýcarsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 2.067

Kód RIV

RIV/00216224:14210/19:00109506

Organizační jednotka

Filozofická fakulta

UT WoS

000461601000001

Klíčová slova česky

deprese; žánr; morfologie; kvantitativní lingvistika; prediktivní modely

Klíčová slova anglicky

depression; genre; morphology; quantitative linguistics; predictive model

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 13. 5. 2020 19:34, Mgr. Zuzana Matulíková

Anotace

V originále

This study examines the relationship between language use and psychological characteristics of the communicator. The aim of the study was to find models predicting the depressivity of the writer based on the computational linguistic markers of his/her written text. Respondents' linguistic fingerprints were traced in four texts of different genres. Depressivity was measured using the Depression, Anxiety and Stress Scale (DASS-21). The research sample (N = 172, 83 men, 89 women) was created by quota sampling an adult Czech population. Morphological variables of the texts showing differences (M-W test) between the non-depressive and depressive groups were incorporated into predictive models. Results: Across all participants, the data best fit predictive models of depressivity using morphological characteristics from the informal text "letter from holidays" (Nagelkerke r(2) = 0.526 for men and 0.670 for women). For men, models for the formal texts "cover letter" and "complaint" showed moderate fit with the data (r(2) = 0.479 and 0.435). The constructed models show weak to substantial recall (0.235 - 0.800) and moderate to substantial precision (0.571 - 0.889). Morphological variables appearing in the final models vary. There are no key morphological characteristics suitable for all models or for all genres. The resulting models' properties demonstrate that they should be suitable for screening individuals at risk of depression and the most suitable genre is informal text ("letter from holidays").

Česky

Studie zkoumá vztah mezi používáním jazyka a psychologickými charakteristikami autora textu. Cílem studie bylo nalézt modely předpovídající depresivitu pisatele na základě komputačně lingvistických charakteristik jeho psaného textu. Jazykové "stopy" respondentů byly sledovány ve čtyřech textech různých žánrů. Depresivita byla měřena pomocí Škály deprese, úzkosti a stresu (DASS-21). Výzkumný vzorek (N = 172, 83 mužů, 89 žen) byl vytvořen na základě kvótního výběru dospělé české populace. Morfologické charakteristiky textů vykazující rozdíly (M-W test) mezi nedepresivními a depresivními skupinami byly začleněny do prediktivních modelů. Výsledky: pro prediktivní modely deprese na základě použitých morfologických charakteristik textu vykazuje nejlepší vlastnosti model vycházející z neformálního textu „dopis z dovolené“ (Nagelkerke r(2) = 0,526 pro muže a 0,670 pro ženy). U mužů se ukázaly jako vhodné též modely formálních textů „průvodní dopis“ a „stížnost“ (r(2) = 0,479 a 0,435). Získané modely ukazují slabý až střední silný "recall" (0,235 - 0,800) a střední až silnou přesnost (0,571 - 0,899). Morfologické proměnné vyskytující se ve finálních modelech se liší. Neexistují žádné klíčové morfologické charakteristiky vhodné pro všechny modely nebo pro všechny žánry. Vlastnosti výsledných modelů ukazují, že by měly být vhodné pro screening jedinců s rizikem deprese a nejvhodnějším žánrem je neformální text („dopis z dovolené“).