2019
Czech Court Decisions Corpus (CzCDC 1.0)
NOVOTNÁ, Tereza a Jakub HARAŠTAZákladní údaje
Originální název
Czech Court Decisions Corpus (CzCDC 1.0)
Autoři
Vydání
2019
Nakladatel
LINDAT/CLARIN digital library at the Institute of Formal and Applied Linguistics (ÚFAL), Faculty of Mathematics and Physics, Charles University
Další údaje
Jazyk
angličtina
Typ výsledku
Účelové publikace
Obor
50501 Law
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Označené pro přenos do RIV
Ne
Organizační jednotka
Právnická fakulta
Klíčová slova česky
právní texty; soudní rozhodnutí
Klíčová slova anglicky
legal texts; judicial decisions; court decisions
Změněno: 21. 12. 2020 07:42, JUDr. Mgr. Jakub Harašta, Ph.D.
V originále
This is the Czech Court Decisions Corpus (CzCDC 1.0). This corpus contains whole texts of the decisions from three top-tier courts (Supreme, Supreme Administrative and Constitutional court) in Czech republic. Court decisions are published from 1st January 1993 to 30th September 2018. The language of decisions is Czech. Content of decisions is unedited and obtained directly from the competent court. Decisions are in .txt format in three folders divided by courts. Corpus contains three .csv files containing the list of all decisions with four columns: - name of the file: exact file name of a decision with extension .txt; - decision identifier (docket number): official identification of the decision as issued by the court; - date of decision: in ISO 8601 (YYYY-MM-DD); - court abbreviation: SupCo for Supreme Court, SupAdmCo for Supreme Administrative Court, ConCo for Constitutional Court Statistics: - SupCo: 111 977 decisions, 23 699 639 lines, 224 061 129 words, 1 462 948 200 bits; - SupAdmCo: 52 660 decisions, 18 069 993 lines, 137 839 985 words, 1 067 826 507 bits; - ConCo: 73 086 decisions, 6 178 371 lines, 98 623 753 words, 664 657 755 bits - all courts combined: 237 723 decisions, 47 948 003 lines, 460 524 867 words, 3 195 432 462 bits
Česky
Poznámka: Dataset je indexován ve Web of Science v kolekci Data Citation Index pod Accession Number DRCI:DATA2020168019855626.
Návaznosti
| GA17-20645S, projekt VaV |
|