D 2006

WebBootCaT: instant domain-specific corpora to support human translators

BARONI, Marco, Adam KILGARRIFF, Jan POMIKÁLEK and Pavel RYCHLÝ

Basic information

Original name

WebBootCaT: instant domain-specific corpora to support human translators

Name in Czech

WebBootCaT: instantní doménové korpusy pro podporu překladatelů

Authors

BARONI, Marco (380 Italy), Adam KILGARRIFF (826 United Kingdom of Great Britain and Northern Ireland), Jan POMIKÁLEK (203 Czech Republic, guarantor) and Pavel RYCHLÝ (203 Czech Republic)

Edition

Oslo, Proceedings of EAMT 2006 - 11th Annual Conference of the European Association for Machine Translation, p. 247-252, 252 pp. 2006

Publisher

The Norwegian National LOGON Consortium and The Deparments of Computer Science and Linguistics and Nordic Studies at Oslo University (Norway)

Other information

Language

English

Type of outcome

Stať ve sborníku

Field of Study

10201 Computer sciences, information science, bioinformatics

Country of publisher

Norway

Confidentiality degree

není předmětem státního či obchodního tajemství

References:

RIV identification code

RIV/00216224:14330/06:00015353

Organization unit

Faculty of Informatics

ISBN

82-7368-294-3

Keywords in English

webbootcat; bootcat; web; corpus
Změněno: 28/6/2006 20:36, RNDr. Jan Pomikálek, Ph.D.

Abstract

V originále

We present a web service to aid translators by quickly producing corpora for specialist areas, in any of a range of languages, from the web. The underlying BootCaT tools have already been extensively used: here, we present a version which is easy for non-technical people to use as all they need do is fill in a web form. The corpus, once produced, can be either downloaded or loaded into the Sketch Engine, a corpus query tool, for further exploration. Reference corpora are used to identify the key terms in the specialist domain.

In Czech

Prezentujeme webovou službu pro rychlou tvorbu doménově orientovaných korpusů z WWW. Aplikace je jazykově nezávislá a může sloužit jako pomůcka při překladu textů. Sada nástrojů BootCaT již byla v minulosti hojně používána. Zde však prezentujeme verzi, která je vhodná i pro netechnicky zaměřené uživatele, neboť k ovládání stačí vyplnit formulář na webové stránce. Vytvořený korpus může být stažen na lokální disk nebo vložen do korpusového manažeru Sketch Engine k podrobnému prozkoumání. Systém využívá referenčních korpusů pro identifikaci klíčových slov v rámci odborných domén.

Links

1ET100300419, research and development project
Name: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Academy of Sciences of the Czech Republic, Intelligent Models, Algorithms, Methods and Tools for the Semantic Web (realization)