p 2018

NovaMorf - nová morfologie pro značkování korpusů češtiny

OSOLSOBĚ, Klára, Jaroslava HLAVÁČOVÁ, Vladimír PETKEVIČ, Šimandl JOSEF, MARTIN SVÁŠEK et. al.

Základní údaje

Originální název

NovaMorf - nová morfologie pro značkování korpusů češtiny

Název česky

NovaMorf - nová morfologie pro značkování korpusů češtiny

Název anglicky

NovaMorf - A New Morphological Tagging for Czech Corpora

Autoři

OSOLSOBĚ, Klára, Jaroslava HLAVÁČOVÁ, Vladimír PETKEVIČ, Šimandl JOSEF a MARTIN SVÁŠEK

Vydání

Linguistic Mondays - Seminar of formal linguistics, 2018

Další údaje

Jazyk

čeština

Typ výsledku

Vyžádané přednášky

Obor

60203 Linguistics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Organizační jednotka

Filozofická fakulta

Klíčová slova česky

morfologiské značkování, jazykový korpus

Klíčová slova anglicky

morphological tagging, corpus
Změněno: 3. 1. 2019 11:03, prof. Mgr. Pavel Kosek, Ph.D.

Anotace

V originále

Autoři představí návrh nového morfologického značkování českých korpusů, pracovně nazývaný NovaMorf. Uvedou nejprve motivaci nového systému značkování: (a) snaha uvést v soulad dosavadní morfologické systémy (hlavně pražský a brněnský) (b) zpřehlednění systému značkování a zajištění konzistence. Představí nový tagset, tedy morfologické kategorie a jejich hodnoty, z nichž některé jsou navrženy odlišně od dosavadního pojetí. Zaměří se přitom zvláště na podstatné nové rysy v novém značkování. Částečně se dotknou i lemmatizace, především zavedení konceptu vícenásobného lemmatu.