D 2008

The Saara Framework: Work in Progress

NĚMČÍK, Václav

Basic information

Original name

The Saara Framework: Work in Progress

Name in Czech

Systém Saara

Authors

NĚMČÍK, Václav (203 Czech Republic, guarantor, belonging to the institution)

Edition

2. vyd. Brno, RASLAN 2008, p. 11-16, 6 pp. 2008

Publisher

Masarykova Univerzita

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Country of publisher

Czech Republic

Confidentiality degree

není předmětem státního či obchodního tajemství

Publication form

printed version "print"

References:

RIV identification code

RIV/00216224:14330/08:00027135

Organization unit

Faculty of Informatics

ISBN

978-80-210-4741-9

UT WoS

000302212600005

Keywords in English

anaphora; anaphora resolution; framework; salience; czech;
Změněno: 26/7/2021 01:18, Mgr. Václav Němčík

Abstract

V originále

The determination of reference and referential links in discourse is one of the important challenges in natural language understanding. The first commonly adopted step towards this objective is to determine coreference classes over the set of referring expressions. We present a modular framework for automatic anaphora resolution which makes it possible to specify various anaphora resolution algorithms and to use them to build AR systems, in principle, for any natural language. The functionality of the system is shown on selected salience-based algorithms customized for Czech.

In Czech

Určení referencí výrazů a referenčních vztahů v diskursu je jedním z nejdůležitějších úkolů, které je třeba řešit při automatickém porozumění textu. Prvním krokem k tomuto cíli je určit koreferenční třídy nad množinou referenčních výrazů. Tento článek představuje modulární systém pro automatickou analýzu anafor, který umožňuje používat různé algoritmy pro analýzu anafor a aplikovat je obecně vzato na libovolný jazyk. Funkcionalita systému je ilustrována na vybraných algoritmech založených na modelování aktivovanosti a upravených pro češtinu.

Links

LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky
2C06009, research and development project
Name: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Acronym: COT-SEWing)
Investor: Ministry of Education, Youth and Sports of the CR