D 2019

Comparing majka and MorphoDiTa for Automatic Grammar Checking

MACHURA, Jakub; Helena GERŽOVÁ; Markéta MASOPUSTOVÁ a Marie VALÍČKOVÁ

Základní údaje

Originální název

Comparing majka and MorphoDiTa for Automatic Grammar Checking

Název česky

Porovnání majky a MorphoDiTy s ohledem na automatickou kontrolou gramatiky

Autoři

MACHURA, Jakub; Helena GERŽOVÁ ORCID; Markéta MASOPUSTOVÁ a Marie VALÍČKOVÁ

Vydání

Brno, Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, od s. 3-14, 12 s. 2019

Nakladatel

Tribun EU

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

60203 Linguistics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14210/19:00108375

Organizační jednotka

Filozofická fakulta

ISBN

978-80-263-1530-8

ISSN

Klíčová slova anglicky

syntactic analysis; SET; grammar checker; punctuation; comma; homonymy; grammatical agreement; subject-predicate agreement; colloquial expressions; zeugma

Štítky

Příznaky

Mezinárodní význam
Změněno: 27. 6. 2024 10:42, Mgr. Michal Petr

Anotace

V originále

Developing a grammar checker requires the most accurate morphological analysis. We have been using the majka analyzer and DESAMB tagger so far, but due to certain obstacles to disambiguation, we encountered many errors in morphological analysis. Nowadays, there are several tools that achieve comparable results. Therefore, it was beneficial to test the one which is well-kept and open-source – the MorphoDiTa system. For the detection of grammatical, stylistic and punctuation errors we use mainly special grammars built into the SET parser and this paper presents results based on outputs of both morphological analyzers.

Návaznosti

TL02000146, projekt VaV
Název: Webový pravopisný, gramatický a typografický korektor pro český jazyk
Investor: Technologická agentura ČR, Webový pravopisný, gramatický a typografický korektor pro český jazyk