D 2011

Syntactic Analysis Using Finite Patterns: A New Parsing System for Czech

KOVÁŘ, Vojtěch, Aleš HORÁK a Miloš JAKUBÍČEK

Základní údaje

Originální název

Syntactic Analysis Using Finite Patterns: A New Parsing System for Czech

Autoři

KOVÁŘ, Vojtěch ORCID (203 Česká republika, garant, domácí), Aleš HORÁK (203 Česká republika, domácí) a Miloš JAKUBÍČEK (203 Česká republika, domácí)

Vydání

Berlin/Heidelberg, Human Language Technology. Challenges for Computer Science and Linguistics, od s. 161-171, 11 s. 2011

Nakladatel

Springer

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

URL

Kód RIV

RIV/00216224:14330/11:00049734

Organizační jednotka

Fakulta informatiky

ISBN

978-3-642-20094-6

Klíčová slova anglicky

syntactic analysis; freeword- order languages; an alternative approach; natural language processing

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 20. 6. 2013 11:12, doc. RNDr. Aleš Horák, Ph.D.

Anotace

ORIG CZ

V originále

Syntactic analysis of natural languages is considered to be one of the basic steps to advanced natural language processing, such as logical analysis or information retrieval with natural language texts. The Czech language can be characterized as a morphologically rich language with a relatively free word order, which further complicates the problem of syntactic analysis. Current parsing systems for Czech fight many problems including low precision or high ambiguity of the parser output. In this paper, we show a new approach to syntactic analysis of free-word-order languages based on the idea of pattern matching linking rules. The system, named SET, is currently developed and tested with the Czech language as a representative of free-word-order languages with very rich morphological system. We briefly mention current approaches and parsing systems for Czech. Then we describe the basic ideas as well as details of SET’s prototype implementation of the pattern matching approach to syntactic analysis.

Česky

Článek prezentuje novou metodu pro syntaktickou analýzu jazyků s volným pořádkem slov ve větě, založenou na vyhledávání konečných vzorků. Metoda je implementována v systému SET.

Návaznosti

GAP401/10/0792, projekt VaV
Název: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce
248307, interní kód MU
Název: Pattern Recognition-based Statistically Enhanced MT (Akronym: PRESEMT)
Investor: Evropská unie, Pattern Recognition-based Statistically Enhanced MT, Spolupráce
Zobrazeno: 15. 1. 2025 10:56