D 2007

Morphological Analysis of Law texts

PALA, Karel; Pavel RYCHLÝ a Pavel ŠMERK

Základní údaje

Originální název

Morphological Analysis of Law texts

Název česky

Morfologická analýza právních textů

Autoři

Vydání

Brno, First Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2007, od s. 21-26, 7 s. 2007

Nakladatel

Masaryk University

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/07:00020686

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-4471-5

Klíčová slova anglicky

morphological analysis; partial syntactic analysis; noun groups detection
Změněno: 7. 1. 2019 14:05, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

In the paper we explore the morphology of the Czech law texts including Constitution, acts, public notices and court judgements which form a huge textual database. As many texts from small domains, the used language is partially restricted and in relevant aspects also different from general Czech. The paper presents first results of the morphological analysis of Czech law texts and their conversion to the specific formats. Partly, the partial syntactic analysis has been performed as well.

Česky

V článku jsou popsány první výsledky ze zpracování rozsáhlého korpusu právnických textů zahrnujících Ústavu, zákony, vyhlášky a judikaturu. Stejně jako u mnoha jiných domén je těmito dokumenty používaný jazyk určitým způsobem omezený a zároveň odlišný od běžné češtiny. Na vzorku dat byla provedena jak morfologická analýza a desambiguace, tak i částečná syntaktická analýza, orientovaná zejména na detekci jmenných skupin, tedy právních termínů.

Návaznosti

GA407/07/0679, projekt VaV
Název: Právní e-slovník - PES
Investor: Grantová agentura ČR, Právní e-slovník - PES
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky