BUSHUIEV, Anton, Roman BUSHUIEV, Petr KOUBA, Anatolii FILKIN, Marketa GABRIELOVA, Michal GABRIEL, Jiri SEDLAR, Tomas PLUSKAL4, Jiří DAMBORSKÝ, Stanislav MAZURENKO a Josef SIVIC. Learning to design protein-protein interactions with enhanced generalization. Online. In 12th International Conference on Learning Representations 2024. 2024, 26 s.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Learning to design protein-protein interactions with enhanced generalization
Autoři BUSHUIEV, Anton, Roman BUSHUIEV, Petr KOUBA, Anatolii FILKIN, Marketa GABRIELOVA, Michal GABRIEL, Jiri SEDLAR, Tomas PLUSKAL4, Jiří DAMBORSKÝ, Stanislav MAZURENKO a Josef SIVIC.
Vydání 12th International Conference on Learning Representations 2024, 26 s. 2024.
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10608 Biochemistry and molecular biology
Utajení není předmětem státního či obchodního tajemství
Forma vydání elektronická verze "online"
WWW URL
Organizační jednotka Přírodovědecká fakulta
Klíčová slova anglicky protein-protein interactions; protein design; generalization; self-supervised learning; equivariant 3D representations
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnila: Mgr. Marie Šípková, DiS., učo 437722. Změněno: 24. 4. 2024 10:22.
Anotace
Discovering mutations enhancing protein-protein interactions (PPIs) is critical for advancing biomedical research and developing improved therapeutics. While machine learning approaches have substantially advanced the field, they often struggle to generalize beyond training data in practical scenarios. The contributions of this work are three-fold. First, we construct PPIRef, the largest and non-redundant dataset of 3D protein-protein interactions, enabling effective large-scale learning. Second, we leverage the PPIRef dataset to pre-train PPIformer, a new SE(3)-equivariant model generalizing across diverse protein-binder variants. We fine-tune PPIformer to predict effects of mutations on protein-protein interactions via a thermodynamically motivated adjustment of the pre-training loss function. Finally, we demonstrate the enhanced generalization of our new PPIformer approach by outperforming other state-of-the-art methods on new, non-leaking splits of standard labeled PPI mutational data and independent case studies optimizing a human antibody against SARS-CoV-2 and increasing the thrombolytic activity of staphylokinase.
Návaznosti
EF17_043/0009632, projekt VaVNázev: CETOCOEN Excellence
LM2023055, projekt VaVNázev: Česká národní infrastruktura pro biologická data
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, ELIXIR-CZ: Česká národní infrastruktura pro biologická data
LM2023069, projekt VaVNázev: Výzkumná infrastruktura RECETOX
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, Výzkumná infrastruktura RECETOX
857560, interní kód MU
(Kód CEP: EF17_043/0009632)
Název: CETOCOEN Excellence (Akronym: CETOCOEN Excellence)
Investor: Evropská unie, CETOCOEN Excellence, Spreading excellence and widening participation
90254, velká výzkumná infrastrukturaNázev: e-INFRA CZ II
VytisknoutZobrazeno: 31. 5. 2024 01:27