Diplomová práce

Modular System for Datasets' Metadata Harvesting and Management for eLTER Environmental Research Infrastructure

Bc. Anna Vítová
Anotace

Výzkum v oblasti životního prostředí generuje velké množství dat, která vyžadují jejich další analýzu. Významnou roli v této oblasti hraje síť Long-Term Ecosystem Research (LTER). Ta se v poslední době potýkala s problémem fragmentace dat napříč několika repozitáři, což komplikovalo jejich vyhledávání, analýzu a opětovné využití. Vyvinuté řešení automatizuje sběr, normalizaci a import dat z několika …více

Abstract

Environmental research generates vast amounts of data that require thorough analysis. The Long-Term Ecosystem Research (LTER) network plays a role in this domain, but has recently faced a challenge of its data being fragmented across several repositories, which hindered data discovery and reuse. The developed solution automates the retrieval, normalisation, and ingestion of data from multiple sources …více

Zadání práce

The European Long-term Ecosystem Research Infrastructure (eLTER) is an initiative in which Masaryk University participates through Tom Rebok's research group at the Institute of Computer Science. This project aims to create a collaborative European research environment for sharing and conducting a comprehensive study of environmental data. A key component of this infrastructure is the eLTER DAR data repository, which consolidates data sets from various measurement stations and research institutions.

This thesis focuses on designing and implementing a modular system for the automated harvesting of data sets and metadata from various external repositories. The system will facilitate the mapping of external metadata models to the standards used in eLTER DAR, allowing for both fully automated metadata processing, such as adding information about measurement stations, and manual editing through a user-friendly interface. The solution will demonstrate its functionality by harvesting data from selected external repositories, including Zenodo, B2Share, and SITES. Additionally, it will provide options for manually entering individual records and offer an overview of the status of harvesting processes. The developed solution will be integrated into the eLTER infrastructure services, particularly communicating with the DAR and OAR services. In the written part of the thesis, the student will provide a detailed description of the system architecture and implementation methods, as well as document opportunities for future enhancements with new sources or functionalities.

Práce zkontrolována:
19. 12. 2025 10:01, RNDr. Tomáš Rebok, Ph.D., učo 39685
Jazyk práce
angličtina angličtina
Termín obhajoby
4. 2. 2026
Práce byla úspěšně obhájena

Vedoucí

RNDr. Tomáš Rebok, Ph.D., učo 39685
VSTR CERIT-SC ÚVT MU

Oponent

RNDr. Daniel Kouřil, Ph.D., učo 1388
VSTR CERIT-SC ÚVT MU

  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.