D 2007

Enhancing Anaphora Resolution for Czech

NĚMČÍK, Václav

Basic information

Original name

Enhancing Anaphora Resolution for Czech

Name in Czech

Jak lépe rozpoznávat anaforické vztahy v češtině


NĚMČÍK, Václav (203 Czech Republic, guarantor, belonging to the institution)


1. vyd. Brno, RASLAN 2007, p. 57-62, 6 pp. 2007


Masarykova Univerzita

Other information



Type of outcome

Proceedings paper

Field of Study

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Country of publisher

Czech Republic

Confidentiality degree

is not subject to a state or trade secret

Publication form

printed version "print"


RIV identification code


Organization unit

Faculty of Informatics





Keywords in English

anaphora resolution; linguistic resources; verb valency; semantic plausibility; WordNet; Czech
Changed: 26/7/2021 01:17, Mgr. Václav Němčík


V originále

Resolution of anaphoric reference is one of the most important challenges in natural language processing (NLP). Functionality of most NLP systems crucially relies on an accurate mechanism for determining which expressions in the input refer to the same entity in the real world. The immense complexity of this issue has led the research community to adopt predominantly knowledge-poor methods, despite the fact that these are known to be incapable of solving this task reliably. This paper suggests several ways of extending such methods by further resources and mechanisms in order to arrive at a more adequate anaphora resolution procedure. First, the paper sketches how to exploit information about verb valencies or co-occurrence statistics to account for semantic plausibility of individual antecedent candidates. Further, several ways of adapting ML-based AR methods are suggested, so that they account for the structure of the AR task more closely.

In Czech

Rozpoznávání anaforických vztahů je jedním z nejdůležitějších úkolů v automatickém zpracování přirozeného jazyka (ZPJ). Funkčnost většiny systémů ZPJ závisí na vhodnm mechanismu, jenž spolehlivě určí, které výrazy ve vstupním textu odkazují ke stejným entitám ve světě. Obtížnost této problematiky má za následek, že se v praxi používají metody zanedbávající sémantické znalosti, přestože jsou k řešení této úlohy potřeba. Tento článek předkládá několik způsobů, jak tyto metody rozšířit a zvýšit tak jejich úspěšnost. Je nastíněno, jak lze využít informace o slovesných valencích nebo společných výskytech slov k posouzení sémantické vhodnosti kandidátů na antecedent. Dále jsou v článku navrženy možné úpravy metod založených na strojovém učení, aby lépe odrážely strukturu úlohy rozpoznávání anaforických vztahů.


LC536, research and development project
Name: Centrum komputační lingvistiky
Investor: Ministry of Education, Youth and Sports of the CR, Centrum komputační lingvistiky