D 2008

GDEX: Automatically finding good dictionary examples in a corpus

RYCHLÝ, Pavel; Miloš HUSÁK; Adam KILGARRIFF; Michael RUNDELL; Katy MCADAM et. al.

Základní údaje

Originální název

GDEX: Automatically finding good dictionary examples in a corpus

Název česky

GDEX: Automatické vyhledávání dobrých slovníkových příkladů v korpusu

Autoři

RYCHLÝ, Pavel (203 Česká republika, garant); Miloš HUSÁK (203 Česká republika); Adam KILGARRIFF (826 Velká Británie a Severní Irsko); Michael RUNDELL (826 Velká Británie a Severní Irsko) a Katy MCADAM (826 Velká Británie a Severní Irsko)

Vydání

1. vyd. Barcelona, Proceedings of the XIII EURALEX International Congress, od s. 425-432, 7 s. 2008

Nakladatel

Institut Universitari de Lingüística Aplicada

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Španělsko

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14330/08:00024233

Organizační jednotka

Fakulta informatiky

ISBN

9788496742673

Klíčová slova anglicky

good dictionary examples; evaluation of sentence informativeness and readability

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 8. 1. 2009 09:50, doc. Mgr. Pavel Rychlý, Ph.D.

Anotace

V originále

Users appreciate examples. If a dictionary entry includes contextualized examples of the different senses a word may have, then the user generally gets what they want in a quick and straightforward way. Thus, there are grounds for including lots of examples and contexts. Producing good examples, however, can be labour-intensive, thus, expensive. We automatically found good candidate sentences in a corpus, with which lexicographers could work. The technology used to add examples to an online version of a leading dictionary: we describe and evaluate the project. We consider a range of other ways in which the finding of good examples can bridge the gap between corpuses, dictionaries, and language learning.

Česky

Příklady užití slov či frází v heslem slovníků jsou cenným zdrojem informací. Vytváření vhodných příkladů je ovšem náročná manuální práce. Článek popisuje algoritmus automatické identifikace vět z korpusu, které mohou sloužit jako dobré příklady užití pro slovníková hesla.

Návaznosti

LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
1ET200610406, projekt VaV
Název: Jazyková poradna na internetu
Investor: Akademie věd ČR, Jazyková poradna na internetu
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce