D 2007

Enhancing Anaphora Resolution for Czech

NĚMČÍK, Václav

Základní údaje

Originální název

Enhancing Anaphora Resolution for Czech

Název česky

Jak lépe rozpoznávat anaforické vztahy v češtině

Autoři

NĚMČÍK, Václav (203 Česká republika, garant, domácí)

Vydání

1. vyd. Brno, RASLAN 2007, od s. 57-62, 6 s. 2007

Nakladatel

Masarykova Univerzita

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

20200 2.2 Electrical engineering, Electronic engineering, Information engineering

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Kód RIV

RIV/00216224:14330/07:00023097

Organizační jednotka

Fakulta informatiky

ISBN

978-80-210-4471-5

UT WoS

000268015500007

Klíčová slova anglicky

anaphora resolution; linguistic resources; verb valency; semantic plausibility; WordNet; Czech
Změněno: 26. 7. 2021 01:17, Mgr. Václav Němčík

Anotace

V originále

Resolution of anaphoric reference is one of the most important challenges in natural language processing (NLP). Functionality of most NLP systems crucially relies on an accurate mechanism for determining which expressions in the input refer to the same entity in the real world. The immense complexity of this issue has led the research community to adopt predominantly knowledge-poor methods, despite the fact that these are known to be incapable of solving this task reliably. This paper suggests several ways of extending such methods by further resources and mechanisms in order to arrive at a more adequate anaphora resolution procedure. First, the paper sketches how to exploit information about verb valencies or co-occurrence statistics to account for semantic plausibility of individual antecedent candidates. Further, several ways of adapting ML-based AR methods are suggested, so that they account for the structure of the AR task more closely.

Česky

Rozpoznávání anaforických vztahů je jedním z nejdůležitějších úkolů v automatickém zpracování přirozeného jazyka (ZPJ). Funkčnost většiny systémů ZPJ závisí na vhodnm mechanismu, jenž spolehlivě určí, které výrazy ve vstupním textu odkazují ke stejným entitám ve světě. Obtížnost této problematiky má za následek, že se v praxi používají metody zanedbávající sémantické znalosti, přestože jsou k řešení této úlohy potřeba. Tento článek předkládá několik způsobů, jak tyto metody rozšířit a zvýšit tak jejich úspěšnost. Je nastíněno, jak lze využít informace o slovesných valencích nebo společných výskytech slov k posouzení sémantické vhodnosti kandidátů na antecedent. Dále jsou v článku navrženy možné úpravy metod založených na strojovém učení, aby lépe odrážely strukturu úlohy rozpoznávání anaforických vztahů.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky