D 2004

The Sketch Engine

KILGARRIFF, Adam, Pavel RYCHLÝ, Pavel SMRŽ a David TUGWELL

Základní údaje

Originální název

The Sketch Engine

Název česky

Sketch Engine

Autoři

KILGARRIFF, Adam (826 Velká Británie a Severní Irsko), Pavel RYCHLÝ (203 Česká republika, garant), Pavel SMRŽ (203 Česká republika) a David TUGWELL (826 Velká Británie a Severní Irsko)

Vydání

Lorient, France, Proceedings of the Eleventh EURALEX International Congress, od s. 105-116, 12 s. 2004

Nakladatel

Universite de Bretagne-Sud

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Francie

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/04:00010460

Organizační jednotka

Fakulta informatiky

ISBN

2952245703

Klíčová slova anglicky

corpora; corpus management; statistics; word sketches
Změněno: 18. 1. 2005 11:22, doc. RNDr. Pavel Smrž, Ph.D.

Anotace

V originále

Word sketches are one-page automatic, corpus-based summaries of a word s grammatical and collocational behaviour. They were first used in the production of the Macmillan English Dictionary and were presented at Euralex 2002. At that point, they only existed for English. Now, we have developed the Sketch Engine, a corpus tool which takes as input a corpus of any language and a corresponding grammar patterns and which generates word sketches for the words of that language. It also generates a thesaurus and sketch differences , which specify similarities and differences between near-synonyms. We briefly present a case study investigating applicability of the Sketch Engine to free wordorder languages. The results show that word sketches could facilitate lexicographic work in Czech as they have for English.

Česky

Sketch engine je korpusový nástroj, který bere jako vstup korpus libovolného jazyka a příslušné gramatické vzory a generuje jednostránkové charakteristiky gramatických a kolokačních vlastností zadaných slov. Produkt je demonstrován na češtině a angličtině.

Návaznosti

MSM 143300003, záměr
Název: Interakce člověka s počítačem, dialogové systémy a asistivní technologie
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Interakce člověka s počítačem, dialogové systémy a asistivní technologie