ČECH, Radek a Miroslav VEPŘEK. Stylometrická analýza církevněslovanských textů české provenience. SLAVIA-časopis pro slovanskou filologii. CZECH REPUBLIC: SLOVANSKY USTAV AKAD CESKE REPUBLIKY, 2023, roč. 92, č. 5, s. 625-640. ISSN 0037-6736. Dostupné z: https://dx.doi.org/10.58377/slav.2023.5.06.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Stylometrická analýza církevněslovanských textů české provenience
Název anglicky Stylometric Analysis of the Church Slavonic Texts of Czech Origin
Autoři ČECH, Radek (203 Česká republika, garant, domácí) a Miroslav VEPŘEK (203 Česká republika).
Vydání SLAVIA-časopis pro slovanskou filologii, CZECH REPUBLIC, SLOVANSKY USTAV AKAD CESKE REPUBLIKY, 2023, 0037-6736.
Další údaje
Originální jazyk čeština
Typ výsledku Článek v odborném periodiku
Obor 60203 Linguistics
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW URL
Impakt faktor Impact factor: 0.200 v roce 2022
Organizační jednotka Filozofická fakulta
Doi http://dx.doi.org/10.58377/slav.2023.5.06
Klíčová slova anglicky cluster analysis; Czech Church Slavonic; lexical diversity; stylometric analysis; token length
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: prof. Radek Čech, Ph.D., učo 234915. Změněno: 4. 6. 2024 14:17.
Anotace
Příspěvek představuje pilotní studii stylistické analýzy českých církevněslovanských textů. Cílem studie je měření podobností/rozdílů mezi texty na základě vybraných kvantitativních charakteristik. Konkrétně je použita průměrná délka tokenu (ATL), klouzavý průměrný poměr typů a tokenů (MATTR) a textové vzdálenosti určené normalizovanými frekvencemi nejfrekventovanějších slov (MFW). Pro analýzu byl použit korpus dvanácti církevněslovanských literárních spisů připisovaných (s různou pravděpodobností) českým autorům v 10. a 11. století. Navíc byly přidány další dva textové prameny (Codex Suprasliensis a Život svatého Metoděje), aby bylo možné porovnat výsledky a získat komplexnější pohled na vztahy mezi texty. Výsledky ukazují věrohodnost aplikace metod na tomto specifickém vzorku textů.
Anotace anglicky
The paper presents a pilot study of stylometric analysis of Czech Church Slavonic texts. The aim of the study is to measure similarities / differences among texts based on selected quantitative characteristics. Specifically, the average token length (ATL), moving average type-token ratio (MATTR), and text distances determined by normalized frequencies of the most frequent words (MFW) are applied. For the analysis, we used a corpus of twelve Church Slavonic literary writings attributed (with various probability) to Czech authors in the 10th and 11th centuries. In addition, two more textual sources were added (Codex Suprasliensis and the Life of St. Methodius) to compare the results and get a more complex view of relationships among texts. The results show the plausibility of the application of methods on this specific sample of texts.
VytisknoutZobrazeno: 26. 7. 2024 00:32