D 2009

The Saara Framework: An Anaphora Resolution System for Czech

NĚMČÍK, Václav

Základní údaje

Originální název

The Saara Framework: An Anaphora Resolution System for Czech

Název česky

Saara: Systém pro automatickou analýzu anafor pro češtinu

Autoři

NĚMČÍK, Václav (203 Česká republika, garant, domácí)

Vydání

1. vyd. Brno, RASLAN 2009 : Recent Advances in Slavonic Natural Language Processing, od s. 49-54, 6 s. 2009

Nakladatel

Masaryk University

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/09:00038427

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-5048-8

Klíčová slova česky

anafora; čeština; syntaktická analýza

Klíčová slova anglicky

anaphora; anaphora resolution; Czech; system; framework; syntactic analysis

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 26. 7. 2021 01:17, Mgr. Václav Němčík

Anotace

V originále

Determining reference and referential links in discourse is one of the biggest and most important challenges in natural language understanding. In particular, computing coreference classes over the set of referring expressions in text is crucial for its further syntactic and semantic processing. We present a system for automatic anaphora resolution that can be used on arbitrary texts in Czech. The article describes the individual phases of processing the input text and mentions selected issues that need to be addressed by the system.

Česky

Určení reference a referenčních vztahů v diskursu je jedním z největších a nejdůležitějších úkolů v oblasti porozumění přirozenému jazyku. Zejména získání koreferenčních tříd nad referenčními výrazy v textu je klíčové pro jeho další syntaktické a sémantické zpracování. V tomto článku je představen systém pro automatické určování anaforických vztahů, který je použitelný na libovolné české texty. Článek popisuje jednotlivé fáze zpracování vstupního textu a věnuje se vybraným problémům, které se během zpracování musí řešit.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky