Bakalářská práce

Rozpoznání a archivace českého webu mimo národní doménu

Identification and archiving of the Czech web outside the national domain

Ivan Vlček, učo 172585
Anotace

Cieľom práce bolo navrhnúť a zrealizovať systém pre rozpoznávanie a archiváciu webových informačných zdrojov ako súčasť archivačného systému Heritrix. Systém by mal tieto zdroje čo najpresnejšie a najefektívnejšie automaticky identifikovať a archivovať pre využitie v projekte WebArchiv Národnej knižnice ČR. Programové riešenie systému je implementované v jazyku Java. Program využíva funkcie viacerých projektov. Zvolenou platformou bol Linux s vývojovým prostredím NetBeans.

Abstract

The goal of the work was to design and realize the system for identification and archiving of web informative sources as a part of the archiving system Heritrix. The System should automatically identify these sources in a most efective and precise way and archive them for the usage of project WebArchiv of National Library of the Czech Republic. The code design is implemented in programming language Java. Program uses functions of several projects. Chosen platform was Linux with Netbeans IDE.

Zadání práce
Navrhněte a vytvořte systém pro rozpoznání a archivaci bohemikálních webových informačních zdrojů jako součást archivačního systému Heritrix. Systém by měl tyto zdroje co nejpřesněji a nejefektivněji automaticky identifikovat a archivovat pro využití v projektu Webarchiv Národní knihovny ČR.
Práce zkontrolována:
11. 10. 2008 13:02, (IS automaticky)
Plný text práce
983,1 KB / soubor PDF
Jazyk práce
slovenština slovenština
Termín obhajoby
26. 6. 2008
Práce byla úspěšně obhájena

Vedoucí

Ing. Petr Žabička

Oponent

Mgr. Bc. Lukáš Matějka, učo 49968
abs FI MU, ESF MU

  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.