k 2019

Comparing majka and MorphoDiTa for Automatic Grammar Checking

MACHURA, Jakub, Helena GERŽOVÁ, Markéta MASOPUSTOVÁ a Marie VALÍČKOVÁ

Základní údaje

Originální název

Comparing majka and MorphoDiTa for Automatic Grammar Checking

Název česky

Porovnání majky a MorphoDiTy s ohledem na automatickou kontrolou gramatiky

Autoři

MACHURA, Jakub, Helena GERŽOVÁ, Markéta MASOPUSTOVÁ a Marie VALÍČKOVÁ

Vydání

Thirteen Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2019, 2019

Další údaje

Jazyk

angličtina

Typ výsledku

Prezentace na konferencích

Obor

60203 Linguistics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Organizační jednotka

Filozofická fakulta

Klíčová slova anglicky

syntactic analysis;SET;grammar checker;punctuation;comma;homonymy;grammatical agreement;subject-predicate agreement;colloquial expressions;zeugma

Příznaky

Mezinárodní význam
Změněno: 14. 1. 2021 22:50, prof. Mgr. Pavel Kosek, Ph.D.

Anotace

V originále

Developing a grammar checker requires the most accurate morphological analysis. We have been using the majka analyzer and DESAMB tagger so far, but due to certain obstacles to disambiguation, we encountered many errors in morphological analysis. Nowadays, there are several tools that achieve comparable results. Therefore, it was beneficial to test the one which is well-kept and open-source – the MorphoDiTa system. For the detection of grammatical, stylistic and punctuation errors we use mainly special grammars built into the SET parser and this paper presents results based on outputs of both morphological analyzers.

Návaznosti

MUNI/A/1061/2018, interní kód MU
Název: Čeština v jednotě synchronie a diachronie - 2019
Investor: Masarykova univerzita, Čeština v jednotě synchronie a diachronie - 2019, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
TL02000146, projekt VaV
Název: Webový pravopisný, gramatický a typografický korektor pro český jazyk
Investor: Technologická agentura ČR, Webový pravopisný, gramatický a typografický korektor pro český jazyk