J 2021

SoluProt: prediction of soluble protein expression in Escherichia coli

HON, Jiří; Martin MARUSIAK; Tomas MARTINEK; Antonín KUNKA; Jaroslav ZENDULKA et al.

Základní údaje

Originální název

SoluProt: prediction of soluble protein expression in Escherichia coli

Autoři

HON, Jiří; Martin MARUSIAK; Tomas MARTINEK; Antonín KUNKA; Jaroslav ZENDULKA; David BEDNÁŘ a Jiří DAMBORSKÝ

Vydání

Bioinformatics, Oxford, Oxford University Press, 2021, 1367-4803

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10602 Biology , Evolutionary biology

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Impakt faktor

Impact factor: 6.931

Označené pro přenos do RIV

Ano

Kód RIV

RIV/00216224:14310/21:00119188

Organizační jednotka

Přírodovědecká fakulta

EID Scopus

Klíčová slova anglicky

SOLUBILITY; WEBSERVER; TOPOLOGY; ACCURATE

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 15. 2. 2024 09:29, Mgr. Marie Novosadová Šípková, DiS.

Anotace

V originále

Motivation: Poor protein solubility hinders the production of many therapeutic and industrially useful proteins. Experimental efforts to increase solubility are plagued by low success rates and often reduce biological activity. Computational prediction of protein expressibility and solubility in Escherichia coli using only sequence information could reduce the cost of experimental studies by enabling prioritization of highly soluble proteins. Results: A new tool for sequence-based prediction of soluble protein expression in E.coli, SoluProt, was created using the gradient boosting machine technique with the TargetTrack database as a training set. When evaluated against a balanced independent test set derived from the NESG database, SoluProt's accuracy of 58.5% and AUC of 0.62 exceeded those of a suite of alternative solubility prediction tools. There is also evidence that it could significantly increase the success rate of experimental protein studies.

Návaznosti

EF17_043/0009632, projekt VaV
Název: CETOCOEN Excellence
GJ20-15915Y, projekt VaV
Název: Studium molekulováho rozpoznávání a vývoj nových softwarových nástrojů pro identifikaci a design přístupových cest v proteinech
Investor: Grantová agentura ČR, Studium molekulováho rozpoznávání a vývoj nových softwarových nástrojů pro identifikaci a design přístupových cest v proteinech
LM2018131, projekt VaV
Název: Česká národní infrastruktura pro biologická data (Akronym: ELIXIR-CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Česká národní infrastruktura pro biologická data
LM2018140, projekt VaV
Název: e-Infrastruktura CZ (Akronym: e-INFRA CZ)
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, e-Infrastruktura CZ
814418, interní kód MU
Název: Synthetic biology-guided engineering of Pseudomonas putida for biofluorination (Akronym: SinFonia)
Investor: Evropská unie, Synthetic biology-guided engineering of Pseudomonas putida for biofluorination, Leadership in enabling and industrial technologies (LEIT) (Industrial Leadership)
857560, interní kód MU
(Kód CEP: EF17_043/0009632)
Název: CETOCOEN Excellence (Akronym: CETOCOEN Excellence)
Investor: Evropská unie, CETOCOEN Excellence, Spreading excellence and widening participation

Přiložené soubory