J 2025

miRBench: novel benchmark datasets for microRNA binding site prediction that mitigate against prevalent microRNA frequency class bias

SAMMUT, Stephanie; Katarína GREŠOVÁ; Dimosthenis TZIMOTOUDIS; Eva MARŠÁLKOVÁ; David ČECHÁK et al.

Základní údaje

Originální název

miRBench: novel benchmark datasets for microRNA binding site prediction that mitigate against prevalent microRNA frequency class bias

Autoři

SAMMUT, Stephanie; Katarína GREŠOVÁ; Dimosthenis TZIMOTOUDIS; Eva MARŠÁLKOVÁ ORCID; David ČECHÁK a Panagiotis ALEXIOU

Vydání

Computational systems bioinformatics / Life Sciences Society. Computational Systems Bioinformatics Conference, OXFORD UNIV PRESS, 2025, 1367-4803

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10609 Biochemical research methods

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 5.400 v roce 2024

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14740/25:00141656

Organizační jednotka

Středoevropský technologický institut

EID Scopus

Klíčová slova anglicky

miRNA; THERAPEUTICS; RNAS

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 14. 3. 2026 21:22, Mgr. Eva Dubská

Anotace

V originále

MicroRNAs (miRNAs) are crucial regulators of gene expression, but the precise mechanisms governing their binding to target sites remain unclear. A major contributing factor to this is the lack of unbiased experimental datasets for training accurate prediction models. While recent experimental advances have provided numerous miRNA–target interactions, these are solely positive interactions. Generating negative examples in silico is challenging and prone to introducing biases, such as the miRNA frequency class bias identified in this work. Biases within datasets can compromise model generalization, leading models to learn dataset-specific artifacts rather than true biological patterns.

Návaznosti

90254, velká výzkumná infrastruktura
Název: e-INFRA CZ II
90267, velká výzkumná infrastruktura
Název: NCMG III