J 2019

Text-Based Detection of the Risk of Depression

HAVIGEROVÁ, Jana Marie, Jiří HAVIGER, Dalibor KUČERA and Petra HOFFMANNOVÁ

Basic information

Original name

Text-Based Detection of the Risk of Depression

Name in Czech

Detekce rizika deprese na základě analýzy textu

Authors

HAVIGEROVÁ, Jana Marie (203 Czech Republic, guarantor, belonging to the institution), Jiří HAVIGER (203 Czech Republic), Dalibor KUČERA (203 Czech Republic) and Petra HOFFMANNOVÁ (203 Czech Republic, belonging to the institution)

Edition

Frontiers in Psychology, Lausanne, Frontiers Media SA, 2019, 1664-1078

Other information

Language

English

Type of outcome

Článek v odborném periodiku

Field of Study

50101 Psychology

Country of publisher

Switzerland

Confidentiality degree

není předmětem státního či obchodního tajemství

References:

Impact factor

Impact factor: 2.067

RIV identification code

RIV/00216224:14210/19:00109506

Organization unit

Faculty of Arts

UT WoS

000461601000001

Keywords (in Czech)

deprese; žánr; morfologie; kvantitativní lingvistika; prediktivní modely

Keywords in English

depression; genre; morphology; quantitative linguistics; predictive model

Tags

Tags

International impact, Reviewed
Změněno: 13/5/2020 19:34, Mgr. Zuzana Matulíková

Abstract

V originále

This study examines the relationship between language use and psychological characteristics of the communicator. The aim of the study was to find models predicting the depressivity of the writer based on the computational linguistic markers of his/her written text. Respondents' linguistic fingerprints were traced in four texts of different genres. Depressivity was measured using the Depression, Anxiety and Stress Scale (DASS-21). The research sample (N = 172, 83 men, 89 women) was created by quota sampling an adult Czech population. Morphological variables of the texts showing differences (M-W test) between the non-depressive and depressive groups were incorporated into predictive models. Results: Across all participants, the data best fit predictive models of depressivity using morphological characteristics from the informal text "letter from holidays" (Nagelkerke r(2) = 0.526 for men and 0.670 for women). For men, models for the formal texts "cover letter" and "complaint" showed moderate fit with the data (r(2) = 0.479 and 0.435). The constructed models show weak to substantial recall (0.235 - 0.800) and moderate to substantial precision (0.571 - 0.889). Morphological variables appearing in the final models vary. There are no key morphological characteristics suitable for all models or for all genres. The resulting models' properties demonstrate that they should be suitable for screening individuals at risk of depression and the most suitable genre is informal text ("letter from holidays").

In Czech

Studie zkoumá vztah mezi používáním jazyka a psychologickými charakteristikami autora textu. Cílem studie bylo nalézt modely předpovídající depresivitu pisatele na základě komputačně lingvistických charakteristik jeho psaného textu. Jazykové "stopy" respondentů byly sledovány ve čtyřech textech různých žánrů. Depresivita byla měřena pomocí Škály deprese, úzkosti a stresu (DASS-21). Výzkumný vzorek (N = 172, 83 mužů, 89 žen) byl vytvořen na základě kvótního výběru dospělé české populace. Morfologické charakteristiky textů vykazující rozdíly (M-W test) mezi nedepresivními a depresivními skupinami byly začleněny do prediktivních modelů. Výsledky: pro prediktivní modely deprese na základě použitých morfologických charakteristik textu vykazuje nejlepší vlastnosti model vycházející z neformálního textu „dopis z dovolené“ (Nagelkerke r(2) = 0,526 pro muže a 0,670 pro ženy). U mužů se ukázaly jako vhodné též modely formálních textů „průvodní dopis“ a „stížnost“ (r(2) = 0,479 a 0,435). Získané modely ukazují slabý až střední silný "recall" (0,235 - 0,800) a střední až silnou přesnost (0,571 - 0,899). Morfologické proměnné vyskytující se ve finálních modelech se liší. Neexistují žádné klíčové morfologické charakteristiky vhodné pro všechny modely nebo pro všechny žánry. Vlastnosti výsledných modelů ukazují, že by měly být vhodné pro screening jedinců s rizikem deprese a nejvhodnějším žánrem je neformální text („dopis z dovolené“).