31. 10.
2008
Dosud nehodnoceno.
Centrum výpočetní techniky FI MU realizuje v letošním roce
projekt digitalizace starších závěrečných prací na Fakultě informatiky MU. Navazuje na zkušenosti z
minulého roku 2007, kdy se tým IS MU podílel
na širším projektu pod vedením RNDr. Miroslava Bartoška, CSc., který
se týkal se digitalizace starších závěrečných prací na
více fakultách MU.
V loňském projektu digitalizace závěrečných prací se skenovaly
závěrečné práce na vybraných fakultách tak, že se nejprve rozřezávaly,
skenovaly a výsledky pak byly předávány Vývojovému týmu IS MU.
V naskenovaných souborech byl OCR nástroji automaticky detekován
a rozpoznáván text a následně byly vytvářeny jak textové verze
prací pro vyhledávání podobných souborů a odhalování plagiátů,
tak PDF verze umožňující narozdíl od naskenovaného originálu
navíc i vyhledávání a extrakci textu. Všechny verze se pak
ukládaly do IS MU do agendy závěrečných prací konkrétnímu uživateli.
Při projektu bylo nutné
řešit problém, kdy se jedna
práce rozpoznávala 5-30 minut, a proto se zakoupily další počítače
pro paralelní zpracování prací.
Celkem bylo zavedeno přes
2000 prací.
Obr. 1: Příklad digitalizované práce
Obr. 2: Evidence digitalizované závěrečné práce v archivu
Proto se nabyté zkušenosti z loňska využily a digitalizují
se letos závěrečné práce z FI MU. Za tuto dobu zaznamenala agenda
pro rozpoznávání naskenovaných
dokumentů v IS MU velký pokrok, a tak byla dokonce
nabídnuta jako aplikace všem uživatelům IS MU. Podrobněji o této službě v novince
o OCR.
Předpokládá se i další využití této služby, plánuje se
například i její nabídnutí absolventům MU, kteří by stáli o to, mít svoji závěrečnou práci v elektronické
verzi. Samotné skenování by probíhalo na fakultách a mnozí knihovníci se tak ochotně rozhodli vyhovět těmto případným zájemcům z řad absolventů.
To umožňuje přijímat jakékoli závěrečné práce z doby před existencí
IS MU a velkou výhodou plošné digitalizace
se stává možnost zrušení tištěných verzí závěrečných prací a
úsporu prostor i financí knihovnám v budoucnu.
31. října 2008