J 2025

Integration, Cataloguing and Management of Biobanking and Clinical Data Using FAIR Genomes Metadata Schema

KACOVÁ, Radoslava; Tomáš HOUFEK; Ondřej HORKÝ; Radovan TOMÁŠIK; Jan KURÁŇ et al.

Základní údaje

Originální název

Integration, Cataloguing and Management of Biobanking and Clinical Data Using FAIR Genomes Metadata Schema

Autoři

Vydání

Data Intelligence, MIT Press, 2025, 2096-7004

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Čína

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14330/25:00140839

Organizační jednotka

Fakulta informatiky

EID Scopus

Klíčová slova anglicky

FAIR data point; FAIR principles; Metadata; Interoperability; Secondary use of healthcare data; Hospital-generated data; Genomic data; Data sharing

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 20. 3. 2026 15:54, Mgr. Eva Špillingová

Anotace

V originále

In the dynamic environment of hospitals, valuable real-world data often remain underutilised despite their potential to revolutionize cancer research and personalised medicine. This study explores the challenges and opportunities in managing hospital-generated data, particularly within the Masaryk Memorial Cancer Institute (MMCI) in Brno, Czech Republic. Utilizing Next-Generation Sequencing (NGS) technology, MMCI generates substantial volumes of genomic data. Due to inadequate curation, these data remain difficult to integrate with clinical records for secondary use (such as personalised treatment outcome prediction and patient stratification based on their genomic profiles). This paper proposes solutions based on the FAIR principles (Findability, Accessibility, Interoperability, and Reusability) to enhance data sharing and reuse. The primary output of our work is the development of an automated pipeline that continuously processes and integrates NGS data with clinical and biobank information upon their creation. It stores the data in a special secured repository for sensitive data in a structured form to ensure smooth retrieval.

Návaznosti

EH22_008/0004644, projekt VaV
Název: Záchrana životů prostřednictvím výzkumu v oblasti včasné detekce a prevence rakoviny: Molekulární, genomické a sociální faktory
LM2023033, projekt VaV
Název: Síť českých biobank
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, BBMRI.cz - Síť českých biobank
MUNI/A/1638/2024, interní kód MU
Název: Umělá inteligence a správa komplexních rozsáhlých dat
Investor: Masarykova univerzita, Umělá inteligence a správa komplexních rozsáhlých dat
90254, velká výzkumná infrastruktura
Název: e-INFRA CZ II