D 2010

A Quantitative Evaluation of Word Sketches

KILGARRIFF, Adam; Vojtěch KOVÁŘ; Simon KREK; Irena SRDANOVIĆ; Carole TIBERIUS et. al.

Základní údaje

Originální název

A Quantitative Evaluation of Word Sketches

Název česky

Formální vyhodnocení Word Sketches

Autoři

KILGARRIFF, Adam (826 Velká Británie a Severní Irsko); Vojtěch KOVÁŘ ORCID (203 Česká republika, garant, domácí); Simon KREK (705 Slovinsko); Irena SRDANOVIĆ (392 Japonsko) a Carole TIBERIUS (528 Nizozemské království)

Vydání

Leeuwarden, Proceedings of the XIV Euralex International Congress, 7 s. 2010

Nakladatel

Fryske Academy

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Nizozemské království

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/10:00044874

Organizační jednotka

Fakulta informatiky

ISBN

978-90-6273-840-3

Klíčová slova česky

word sketches vyhodnocení

Klíčová slova anglicky

word sketches evaluation

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 20. 12. 2010 10:09, RNDr. Vojtěch Kovář, Ph.D.

Anotace

V originále

A word sketch is an automatic corpus-derived summary of a word's grammatical and collocational behaviour. Word sketches were first prepared in 1999 for the compilation of the Macmillan English Dictionary for Advanced Learners (Rundell 2002). They have since been integrated into the Sketch Engine corpus query tool (Kilgarriff et al 2004), prepared for fifteen languages, and used on a large scale for lexicography by a number of publishers. How good are they? We are frequently told how impressive they are and how little they miss - but we would like a more rigorous assessment. In this paper we present a formal evaluation for Dutch, English, Japanese and Slovene.

Česky

Tento článek popisuje výsledky formálního vyhodnocení výstupu aplikace Word Sketches (automatické určování kolokací z korpusových dat, často používané v lexikografii) pro nizozemštinu, angličtinu, japonštinu a slovinštinu.

Návaznosti

GAP401/10/0792, projekt VaV
Název: Temporální aspekty znalostí a informací
Investor: Grantová agentura ČR, Temporální aspekty znalostí a informací
LC536, projekt VaV
Název: Centrum komputační lingvistiky
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Centrum komputační lingvistiky
2C06009, projekt VaV
Název: Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce (Akronym: COT-SEWing)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Prostředky tvorby komplexní báze znalostí pro komunikaci se sémantickým webem v přirozeném jazyce