Bakalářská práce

Big data processing with Spring Batch

Filip Kollár
Anotace

Hlavním cílem této práce je popsat, jak byl použit framework Spring Batch k přeimplementaci a vylepšení aplikace Kramerius+. Aplikace Kramerius+ je rozšiřujícím modulem aplikace Kramerius, která slouží jako systém pro digitální knihovny. Kramerius+ je aplikace, která využívá externí nástroje pro zpracování přirozeného jazyka k obohacení a exportu publikací obsahujících velké množství textových dat …více

Abstract

The main goal of this thesis is to describe how Spring Batch was used to reimplement and improve Kramerius+. Kramerius+ application builds upon a web application Kramerius a system powering digital libraries. Kramerius+ is an application that uses external natural language processing tools to enrich and export publications that contain large amounts of text data. Kramerius+ stores the enriched data …více

Zadání práce
In this bachelor's thesis, the student will design and implement jobs that can process large amounts of data using abstractions offered by Spring Batch. The thesis will introduce the framework and show how to configure robust and reliable automatic jobs that different data structures. The thesis will show how it is possible to use tools offered by the framework to implement jobs and how to design them so they utilize its support to the fullest. Moreover, it will deal with different aspects of designing jobs and their decomposition into steps. It will also show how to use the framework to monitor individual executions of jobs and how to deal with errors encountered while processing. The thesis is written along with InQool a.s., an industrial partner of the Faculty of Informatics.
Práce zkontrolována:
19. 5. 2023 09:05, prof. RNDr. Tomáš Pitner, Ph.D.
Jazyk práce
angličtina angličtina
Termín obhajoby
27. 6. 2023
Práce byla úspěšně obhájena

Vedoucí

prof. RNDr. Tomáš Pitner, Ph.D.
KPSK FI MU

Oponent

Mgr. Tibor Szabó
abs FI MU

Masarykova univerzita Fakulta informatiky
Plán
Programování a vývoj aplikací
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.