J 2023

GERONIMO: A tool for systematic retrieval of structural RNAs in a broad evolutionary context

KILAR, Agata Magdalena, Petr FAJKUS a Jiří FAJKUS

Základní údaje

Originální název

GERONIMO: A tool for systematic retrieval of structural RNAs in a broad evolutionary context

Autoři

KILAR, Agata Magdalena (616 Polsko, domácí), Petr FAJKUS (203 Česká republika, domácí) a Jiří FAJKUS (203 Česká republika, garant, domácí)

Vydání

GigaScience, Oxford University Press, 2023, 2047-217X

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10602 Biology , Evolutionary biology

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 9.200 v roce 2022

Kód RIV

RIV/00216224:14740/23:00133555

Organizační jednotka

Středoevropský technologický institut

UT WoS

001176292300001

Klíčová slova anglicky

evolution; high-throughput pipeline; sequence homology searches; Snakemake

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 9. 10. 2024 12:50, Mgr. Eva Dubská

Anotace

V originále

Background: While web-based tools such as BLAST have made identifying conserved gene homologs appear easy, genes with variable sequences pose significant challenges. Functionally important noncoding RNAs (ncRNA) often show low sequence conservation due to genetic variations, including insertions and deletions. Rather than conserved sequences, these RNAs possess highly conserved structural features across a broad phylogenetic range. Such features can be identified using the covariance models approach, which combines sequence alignment with a secondary RNA structure consensus. However, running standard implementation of that approach (Infernal) requires advanced bioinformatics knowledge compared to user-friendly web services like BLAST. The issue is partially addressed by RNAcentral, which can be used to search for homologs across a broad range of ncRNA sequence collections from diverse organisms but not across the genome assemblies. Results: Here, we present GERONIMO, which conducts evolutionary searches across hundreds of genomes in a fully automated way. It provides results extended with taxonomy context, as summary tables and visualizations, to facilitate analysis for user convenience. Additionally, GERONIMO supplements homologous sequences with genomic regions to analyze promoter motifs or gene collinearity, enhancing the validation of results. Conclusion: GERONIMO, built using Snakemake, has undergone extensive testing on hundreds of genomes, establishing itself as a valuable tool in the identification of ncRNA homologs across diverse taxonomic groups. Consequently, GERONIMO facilitates the investigation of the evolutionary patterns of functionally significant ncRNA players, whose understanding has previously been limited to individual organisms and close relatives.

Návaznosti

GX20-01331X, projekt VaV
Název: Biogeneze a evoluce telomerázy u rostlin
Investor: Grantová agentura ČR, Biogenesis and evolution of telomerase in plants
LM2018131, projekt VaV
Název: Česká národní infrastruktura pro biologická data (Akronym: ELIXIR-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Česká národní infrastruktura pro biologická data
LM2018140, projekt VaV
Název: e-Infrastruktura CZ (Akronym: e-INFRA CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, e-Infrastruktura CZ
52210685, interní kód MU
Název: Visegrad Scholarship Agata Kilar
Investor: Mezinárodní visegrádský fond (IVF), Visegrad Scholarship Agata Kilar