2020
Topic Modelling of the Czech Supreme Court Decisions
NOVOTNÁ, Tereza; Jakub HARAŠTA a Jakub KÓLZákladní údaje
Originální název
Topic Modelling of the Czech Supreme Court Decisions
Autoři
Vydání
CEUR WS, vol. 2764. Aachen, Německo, Proceedings of the Fourth Workshop on Automated Semantic Analysis of Information in Legal Text held online in conjunction with the 33rd International Conference on Legal Knowledge and Information Systems (JURIX 2020), od s. 1-5, 5 s. 2020
Nakladatel
CEUR Workshop Proceedings
Další údaje
Jazyk
angličtina
Typ výsledku
Stať ve sborníku
Obor
50501 Law
Stát vydavatele
Německo
Utajení
není předmětem státního či obchodního tajemství
Forma vydání
elektronická verze "online"
Odkazy
Označené pro přenos do RIV
Ano
Kód RIV
RIV/00216224:14220/20:00117354
Organizační jednotka
Právnická fakulta
ISSN
EID Scopus
Klíčová slova anglicky
topic modelling; Latent Dirichlet Allocation; Non-negative Matrix Factorization; court decisions; coherence score
Štítky
Příznaky
Mezinárodní význam, Recenzováno
Změněno: 29. 3. 2021 16:05, Mgr. Petra Georgala
Anotace
V originále
The Czech Supreme Court produces significant amount of decisions totalling more than 130 000 decisions since 1993. The amount makes it difficult for law practitioners to research this case law. This work focuses on topic models for enhanced information retrieval through identification of case law approaching the same or similar issues. We provide initial quantitative evaluation of Latent Dirichlet Allocation (LDA) and Non-negative Matrix Factorization (NMF) models according to CV coherence score for different number of topics modelled n= {10, 20, ..., 90, 100}. Additionally, we provide qualitative evaluation for LDA and NMF models n= {20, 30} that will serve as a starting point for subsequent expert-user evaluation.
Návaznosti
| MUNI/A/1454/2019, interní kód MU |
|