D 2020

Topic Modelling of the Czech Supreme Court Decisions

NOVOTNÁ, Tereza; Jakub HARAŠTA a Jakub KÓL

Základní údaje

Originální název

Topic Modelling of the Czech Supreme Court Decisions

Autoři

Vydání

CEUR WS, vol. 2764. Aachen, Německo, Proceedings of the Fourth Workshop on Automated Semantic Analysis of Information in Legal Text held online in conjunction with the 33rd International Conference on Legal Knowledge and Information Systems (JURIX 2020), od s. 1-5, 5 s. 2020

Nakladatel

CEUR Workshop Proceedings

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

50501 Law

Stát vydavatele

Německo

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14220/20:00117354

Organizační jednotka

Právnická fakulta

ISSN

EID Scopus

Klíčová slova anglicky

topic modelling; Latent Dirichlet Allocation; Non-negative Matrix Factorization; court decisions; coherence score

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 29. 3. 2021 16:05, Mgr. Petra Georgala

Anotace

V originále

The Czech Supreme Court produces significant amount of decisions totalling more than 130 000 decisions since 1993. The amount makes it difficult for law practitioners to research this case law. This work focuses on topic models for enhanced information retrieval through identification of case law approaching the same or similar issues. We provide initial quantitative evaluation of Latent Dirichlet Allocation (LDA) and Non-negative Matrix Factorization (NMF) models according to CV coherence score for different number of topics modelled n= {10, 20, ..., 90, 100}. Additionally, we provide qualitative evaluation for LDA and NMF models n= {20, 30} that will serve as a starting point for subsequent expert-user evaluation.

Návaznosti

MUNI/A/1454/2019, interní kód MU
Název: Automatické zpracování soudních rozhodnutí: experiment s uživateli
Investor: Masarykova univerzita, Automatické zpracování soudních rozhodnutí: experiment s uživateli, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty