NOVOTNÁ, Tereza a Jakub HARAŠTA. Czech Court Decisions Corpus (CzCDC 1.0). LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University, 2019.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Czech Court Decisions Corpus (CzCDC 1.0)
Autoři NOVOTNÁ, Tereza a Jakub HARAŠTA.
Vydání 2019.
Nakladatel LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University
Další údaje
Originální jazyk angličtina
Typ výsledku Účelové publikace
Obor 50501 Law
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
WWW URL
Organizační jednotka Právnická fakulta
Klíčová slova česky právní texty; soudní rozhodnutí
Klíčová slova anglicky legal texts; judicial decisions; court decisions
Změnil Změnil: JUDr. Mgr. Jakub Harašta, Ph.D., učo 323070. Změněno: 21. 12. 2020 07:42.
Anotace
This is the Czech Court Decisions Corpus (CzCDC 1.0). This corpus contains whole texts of the decisions from three top-tier courts (Supreme, Supreme Administrative and Constitutional court) in Czech republic. Court decisions are published from 1st January 1993 to 30th September 2018. The language of decisions is Czech. Content of decisions is unedited and obtained directly from the competent court. Decisions are in .txt format in three folders divided by courts. Corpus contains three .csv files containing the list of all decisions with four columns: - name of the file: exact file name of a decision with extension .txt; - decision identifier (docket number): official identification of the decision as issued by the court; - date of decision: in ISO 8601 (YYYY-MM-DD); - court abbreviation: SupCo for Supreme Court, SupAdmCo for Supreme Administrative Court, ConCo for Constitutional Court Statistics: - SupCo: 111 977 decisions, 23 699 639 lines, 224 061 129 words, 1 462 948 200 bits; - SupAdmCo: 52 660 decisions, 18 069 993 lines, 137 839 985 words, 1 067 826 507 bits; - ConCo: 73 086 decisions, 6 178 371 lines, 98 623 753 words, 664 657 755 bits - all courts combined: 237 723 decisions, 47 948 003 lines, 460 524 867 words, 3 195 432 462 bits
Anotace česky
Poznámka: Dataset je indexován ve Web of Science v kolekci Data Citation Index pod Accession Number DRCI:DATA2020168019855626.
Návaznosti
GA17-20645S, projekt VaVNázev: Exaktní hodnocení aplikační relevance judikatury
Investor: Grantová agentura ČR, Exaktní hodnocení aplikační relevance judikatury
VytisknoutZobrazeno: 23. 9. 2024 22:24