R 2024

Klasifikátor vazebných kapes v proteinech založený na strojovém učení

HADDADI, Faraneh; Ondřej VÁVRA; David BEDNÁŘ; Stanislav MAZURENKO; Jiří DAMBORSKÝ et. al.

Základní údaje

Originální název

Klasifikátor vazebných kapes v proteinech založený na strojovém učení

Název anglicky

A machine learning-based classifier of binding pockets in proteins

Vydání

2024

Další údaje

Jazyk

čeština

Typ výsledku

Software

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Kód RIV

RIV/00216224:14310/24:00138661

Organizační jednotka

Přírodovědecká fakulta

Klíčová slova anglicky

machine learning; protein; predictor; protein engineering; ligand binding; catalysis

Technické parametry

Doposud je využíváno interně k výzkumným účelům.
Změněno: 4. 4. 2025 07:59, prof. Mgr. Jiří Damborský, Dr.

Anotace

V originále

Některé strukturní prvky proteinů hrají rozhodující roli při navázání a uvolnění ligandů, např. povrchové vazebné rozhraní, tunel s jedním otvorem, který spojuje aktivní místo s vnějším prostředím, nebo oboustranně otevřený kanál. Pro výpočet tunelů a kanálů existuje několik metod, které však vyžadují vlastní nastavení, aby poskytly kvalitní výsledky. Zejména rozlišení mezi povrchovými a zanořenými vazebnými kapsami je pro výpočet tunelu kritické, ale zatím není dořešené. Cílem tohoto klasifikátoru je vyřešit tento problém pomocí funkcí FPOCKET a ručně označeného souboru dat 200 kapes klasifikovaných jako povrchové, hraniční a zanořené. Klasifikátor se skládá z malé umělé neuronové sítě a dosahuje přesnosti 54 % a skóre F1 50 %.

Anglicky

Certain structural elements of proteins play a critical role in binding and unbinding ligands, e.g., the surface binding interface, a tunnel with one opening that connects the active site with the outside environment, or a channel open on both sides. There are several methods for tunnel and channel calculation, but they require customized settings to produce high-quality results. In particular, the discrimination between surface and buried binding pockets is critical for tunnel calculation but is an open problem. This classifier aims to solve this problem using FPOCKET features and manually labelled dataset of 200 pockets classified as surface, borderline, and buried. The classifier consists of a small artificial neural network and achieves the accuracy of 54% and F1 score of 50%.

Návaznosti

LM2023049, projekt VaV
Název: Český národní uzel Evropské sítě infrastruktur klinického výzkumu
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, CZECRIN - Czech National Node to the European Clinical Research Infrastructure Network