J 2018

ToTem: a tool for variant calling pipeline optimization

TOM, Nikola, O. TOM, Jitka MALČÍKOVÁ, Šárka PAVLOVÁ, Blanka KUBEŠOVÁ et. al.

Základní údaje

Originální název

ToTem: a tool for variant calling pipeline optimization

Autoři

TOM, Nikola (203 Česká republika, domácí), O. TOM (203 Česká republika), Jitka MALČÍKOVÁ (203 Česká republika, domácí), Šárka PAVLOVÁ (203 Česká republika, domácí), Blanka KUBEŠOVÁ (203 Česká republika, domácí), T. RAUSCH (276 Německo), M. KOLARIK (203 Česká republika), V. BENES (276 Německo), Vojtěch BYSTRÝ (203 Česká republika, domácí) a Šárka POSPÍŠILOVÁ (203 Česká republika, garant, domácí)

Vydání

BMC Bioinformatics, London, BioMed Central, 2018, 1471-2105

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10608 Biochemistry and molecular biology

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 2.511

Kód RIV

RIV/00216224:14740/18:00101855

Organizační jednotka

Středoevropský technologický institut

UT WoS

000436517200004

Klíčová slova anglicky

Variant calling; Benchmarking; Next generation sequencing; Parameter optimization

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 13. 3. 2019 17:22, Mgr. Pavla Foltynová, Ph.D.

Anotace

V originále

Background: High-throughput bioinformatics analyses of next generation sequencing (NGS) data often require challenging pipeline optimization. The key problem is choosing appropriate tools and selecting the best parameters for optimal precision and recall. Results: Here we introduce ToTem, a tool for automated pipeline optimization. ToTem is a stand-alone web application with a comprehensive graphical user interface (GUI). ToTem is written in Java and PHP with an underlying connection to a MySQL database. Its primary role is to automatically generate, execute and benchmark different variant calling pipeline settings. Our tool allows an analysis to be started from any level of the process and with the possibility of plugging almost any tool or code. To prevent an over-fitting of pipeline parameters, ToTem ensures the reproducibility of these by using cross validation techniques that penalize the final precision, recall and F-measure. The results are interpreted as interactive graphs and tables allowing an optimal pipeline to be selected, based on the user's priorities. Using ToTem, we were able to optimize somatic variant calling from ultra-deep targeted gene sequencing (TGS) data and germline variant detection in whole genome sequencing (WGS) data. Conclusions: ToTem is a tool for automated pipeline optimization which is freely available as a web application at https://totern.software

Návaznosti

EF16_013/0001818, projekt VaV
Název: Modernizace a podpora výzkumných aktivit národní infrastruktury pro translační medicínu EATRIS-CZ
LM2015064, projekt VaV
Název: Český národní uzel Evropské infrastruktury pro translační medicínu (Akronym: EATRIS-ERIC-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Involvement of Czech Translational Medicine Infrastructure to the European Advanced Translational Research Infrastructure in Medicine
LQ1601, projekt VaV
Název: CEITEC 2020 (Akronym: CEITEC2020)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, CEITEC 2020
MUNI/A/0968/2017, interní kód MU
Název: Nové přístupy ve výzkumu, diagnostice a terapii hematologických malignit V (Akronym: VýDiTeHeMA V)
Investor: Masarykova univerzita, Nové přístupy ve výzkumu, diagnostice a terapii hematologických malignit V, DO R. 2020_Kategorie A - Specifický výzkum - Studentské výzkumné projekty
NV15-30015A, projekt VaV
Název: Analýza klonální heterogenity chronické lymfocytární leukemie pomoci sekvenování nové generace genu pro B-buněčný receptor. Národní studie.
NV15-31834A, projekt VaV
Název: Vliv selekce genomických poškození na průběh chronické lymfocytární leukémie
TE02000058, projekt VaV
Název: Centrum kompetence pro molekulární diagnostiku a personalizovanou medicínu (Akronym: MOLDIMED)
Investor: Technologická agentura ČR, Centrum kompetence pro molekulární diagnostiku a personalizovanou medicínu
692298, interní kód MU
Název: MEDGENET - Medical genomics and epigenomics network (Akronym: MEDGENET)
Investor: Evropská unie, MEDGENET - Medical genomics and epigenomics network, Spreading excellence and widening participation