J 2020

PENGUINN: Precise Exploration of Nuclear G-Quadruplexes Using Interpretable Neural Networks

KLIMENTOVÁ, Eva; Jakub POLÁČEK; Petr ŠIMEČEK a Panagiotis ALEXIOU

Základní údaje

Originální název

PENGUINN: Precise Exploration of Nuclear G-Quadruplexes Using Interpretable Neural Networks

Vydání

Frontiers in Genetics, Lausanne, Frontiers, 2020, 1664-8021

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10603 Genetics and heredity

Stát vydavatele

Švýcarsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 4.599

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14740/20:00118477

Organizační jednotka

Středoevropský technologický institut

EID Scopus

Klíčová slova anglicky

bioinformatics and computational biology; machine learning; deep neural network; G quadruplex; web application; genomic; imbalanced data classification

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 9. 4. 2021 14:00, Mgr. Pavla Foltynová, Ph.D.

Anotace

V originále

G-quadruplexes (G4s) are a class of stable structural nucleic acid secondary structures that are known to play a role in a wide spectrum of genomic functions, such as DNA replication and transcription. The classical understanding of G4 structure points to four variable length guanine strands joined by variable length nucleotide stretches. Experiments using G4 immunoprecipitation and sequencing experiments have produced a high number of highly probable G4 forming genomic sequences. The expense and technical difficulty of experimental techniques highlights the need for computational approaches of G4 identification. Here, we present PENGUINN, a machine learning method based on Convolutional neural networks, that learns the characteristics of G4 sequences and accurately predicts G4s outperforming state-of-the-art methods. We provide both a standalone implementation of the trained model, and a web application that can be used to evaluate sequences for their G4 potential.

Návaznosti

867414, interní kód MU
Název: Using Deep Learning to understand RNA Binding Protein binding characteristics (Akronym: DEEPLEARNRBP)
Investor: Evropská unie, Using Deep Learning to understand RNA Binding Protein binding characteristics, MSCA Marie Skłodowska-Curie Actions (Excellent Science)
896172, interní kód MU
Název: Deciphering the Language of DNA to Identify Regulatory Elements and Classify Transcripts Into Functional Classes (Akronym: LanguageOfDNA)
Investor: Evropská unie, Deciphering the Language of DNA to Identify Regulatory Elements and Classify Transcripts Into Functional Classes, MSCA Marie Skłodowska-Curie Actions (Excellent Science)

Přiložené soubory