D 2006

WebBootCaT: instant domain-specific corpora to support human translators

BARONI, Marco, Adam KILGARRIFF, Jan POMIKÁLEK a Pavel RYCHLÝ

Základní údaje

Originální název

WebBootCaT: instant domain-specific corpora to support human translators

Název česky

WebBootCaT: instantní doménové korpusy pro podporu překladatelů

Autoři

BARONI, Marco (380 Itálie), Adam KILGARRIFF (826 Velká Británie a Severní Irsko), Jan POMIKÁLEK (203 Česká republika, garant) a Pavel RYCHLÝ (203 Česká republika)

Vydání

Oslo, Proceedings of EAMT 2006 - 11th Annual Conference of the European Association for Machine Translation, od s. 247-252, 252 s. 2006

Nakladatel

The Norwegian National LOGON Consortium and The Deparments of Computer Science and Linguistics and Nordic Studies at Oslo University (Norway)

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Norsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Kód RIV

RIV/00216224:14330/06:00015353

Organizační jednotka

Fakulta informatiky

ISBN

82-7368-294-3

Klíčová slova anglicky

webbootcat; bootcat; web; corpus
Změněno: 28. 6. 2006 20:36, RNDr. Jan Pomikálek, Ph.D.

Anotace

V originále

We present a web service to aid translators by quickly producing corpora for specialist areas, in any of a range of languages, from the web. The underlying BootCaT tools have already been extensively used: here, we present a version which is easy for non-technical people to use as all they need do is fill in a web form. The corpus, once produced, can be either downloaded or loaded into the Sketch Engine, a corpus query tool, for further exploration. Reference corpora are used to identify the key terms in the specialist domain.

Česky

Prezentujeme webovou službu pro rychlou tvorbu doménově orientovaných korpusů z WWW. Aplikace je jazykově nezávislá a může sloužit jako pomůcka při překladu textů. Sada nástrojů BootCaT již byla v minulosti hojně používána. Zde však prezentujeme verzi, která je vhodná i pro netechnicky zaměřené uživatele, neboť k ovládání stačí vyplnit formulář na webové stránce. Vytvořený korpus může být stažen na lokální disk nebo vložen do korpusového manažeru Sketch Engine k podrobnému prozkoumání. Systém využívá referenčních korpusů pro identifikaci klíčových slov v rámci odborných domén.

Návaznosti

1ET100300419, projekt VaV
Název: Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu
Investor: Akademie věd ČR, Inteligentní modely, algoritmy, metody a nástroje pro vytváření sémantického webu