Diplomová práce

Zpřístupnění archivu českého webu

Accessing the Czech Web Archive

Bc. Lukáš Matějka, učo 49968
Anotace

Cílem práce bylo navrhnout a realizovat systém, který by umožnil průběžnou indexaci a zpřístupnění veškerých archivovaných dat vytvořených automatizovaným sklízením. Současně, aby systém využíval stávající nástroje a mohl s~nimi komunikovat. Programové řešení je implementováno v jazyku Java, konkrétně Java servlety, které jsou spojeny s databází a rozšiřují základní funkčnost systému. Program byl vyvíjen …více

Abstract

Thesis deals with proposal and implementation of system for continuos indexing and accessing archived data created by automatous crawling. ARCWayback system is a set of utilities to maintain archives (Internet Archive's ARC format file). Java application stores metadata into MySQL database, provides access to archive through url and time and allows receive all document versions from archive. Java Eclipse IDE was used for the development. Program licence is GPL.

Práce zkontrolována:
11. 10. 2008 12:50, (IS automaticky)
Jazyk práce
čeština čeština
Termín obhajoby
27. 6. 2006
Práce byla úspěšně obhájena

Vedoucí

RNDr. Miroslav Bartošek, CSc., učo 930
KSOV ScColl CERIT-SC ÚVT MU

Oponent

Autor posudku dosud neidentifikován.

 
Název
Vložil
Vloženo
Práva
Archiv závěrečné práce Lukáš Matějka FI N-IN IN, učo 49968 ohdiw/7
11. 5. 2006
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.