11. 5.
2008
Dosud nehodnoceno.
Před několika dny dal Informační systém Masarykovy univerzity svým uživatelům
k dispozici novou službu -
rozpoznávání naskenovaných dokumentů. Pod pojmem
rozpoznávání se rozumí proces označovaný optické rozpoznávání znaků
(OCR - Optical Character Recognition). Skenerem se naskenuje jedna
nebo více stran textu, příp. textu spolu s grafikou a získá se tak
počítačový soubor s obrazem skenované předlohy. Rozpoznáním se získá
ze souboru s obrazem naskenované předlohy text, který pak lze např.
označit myší, může se v něm vyhledávat, přenést text do Wordu a dále
ho zpracovávat a upravovat. Uživatel má na výběr buď pouze vytvoření
textového výstupu, nebo vytvoření dvouvrstvého PDF souboru.
Informační systém MU je schopen rozpoznat soubory uložené do libovolné
agendy, ve které funguje Správce souborů. Tzn. ve Studijních materiálech,
v Úschovně, na Mém webu, v Poskytovně, v Dokumentovém serveru atp.
IS automaticky rozpoznává do formátu text. O rozpoznání do formátu text
není nutné žádat. Kliknutím se požádá o rozpoznání do dvouvrstvého
PDF. Výhodou služby pro rozpoznávání zaintegrované do IS MU je to,
že služba je bez nutnosti instalovat další programové vybavení dostupná
všem uživatelům IS MU a je dostupná tam, kde uživatelé IS MU ukládají
a spravují svoje dokumenty.
Proces rozpoznání dokumentu jistou dobu trvá. Trvání souvisí s velikostí
rozpoznávaného dokumentu a s počtem dokumentů, které jsou ve frontě
před rozpoznávaným dokumentem. Obsah fronty vyřizují rozpoznávací servery
dle priorit a času zařazení do fronty. O ukončení rozpoznání je
uživatel informován automaticky e-mailem.
Za první týden provozu se s informací o existenci této služby seznámilo
5073 uživatelů IS MU, vyzkoušelo si ji 51 uživatelů a nechalo si
rozpoznat 114 souborů. Automaticky bylo za první týden rozpoznáno
15.711 dokumentů celkem. Jedná se o dokumenty, které byly do IS MU
vloženy dříve, ale dosud rozpoznány nebyly. Dalších cca 100.000
dokumentů na rozpoznání ještě čeká.
11. května 2008