J 2024

AlphaFind: discover structure similarity across the proteome in AlphaFold DB

PROCHÁZKA, David, Terézia SLANINÁKOVÁ, Jaroslav OĽHA, Adrián ROŠINEC, Katarína GREŠOVÁ et. al.

Základní údaje

Originální název

AlphaFind: discover structure similarity across the proteome in AlphaFold DB

Autoři

PROCHÁZKA, David (203 Česká republika, domácí), Terézia SLANINÁKOVÁ (703 Slovensko, domácí), Jaroslav OĽHA (703 Slovensko, domácí), Adrián ROŠINEC (703 Slovensko, domácí), Katarína GREŠOVÁ (703 Slovensko, domácí), Miriama JÁNOŠOVÁ (703 Slovensko, domácí), Jakub ČILLÍK (703 Slovensko, domácí), Jana PORUBSKÁ (703 Slovensko, domácí), Radka SVOBODOVÁ (203 Česká republika, domácí), Vlastislav DOHNAL (203 Česká republika, garant, domácí) a Matej ANTOL (703 Slovensko, domácí)

Vydání

Nucleic acids research, Oxford, Oxford University Press, 2024, 0305-1048

Další údaje

Jazyk

angličtina

Typ výsledku

Článek v odborném periodiku

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Velká Británie a Severní Irsko

Utajení

není předmětem státního či obchodního tajemství

Odkazy

URL

Impakt faktor

Impact factor: 14.900 v roce 2022

Organizační jednotka

Fakulta informatiky

DOI

http://dx.doi.org/10.1093/nar/gkae397

UT WoS

001222684000001

Klíčová slova anglicky

AlphaFind;Protein similarity search;Structure-based retrieval;Protein tertiary structure;AlphaFold DB;Machine learning

Štítky

AlphaFind, CODA Research Group, DISA, learned index, LMI, protein similarity search

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 23. 10. 2024 14:59, RNDr. Terézia Slanináková

Anotace

V originále

AlphaFind is a web-based search engine that provides fast structure-based retrieval in the entire set of AlphaFold DB structures. Unlike other protein processing tools, AlphaFind is focused entirely on tertiary structure, automatically extracting the main 3D features of each protein chain and using a machine learning model to find the most similar structures. This indexing approach and the 3D feature extraction method used by AlphaFind have both demonstrated remarkable scalability to large datasets as well as to large protein structures. The web application itself has been designed with a focus on clarity and ease of use. The searcher accepts any valid UniProt ID, Protein Data Bank ID or gene symbol as input, and returns a set of similar protein chains from AlphaFold DB, including various similarity metrics between the query and each of the retrieved results. In addition to the main search functionality, the application provides 3D visualizations of protein structure superpositions in order to allow researchers to instantly analyze the structural similarity of the retrieved results. The AlphaFind web application is available online for free and without any registration at https://alphafind.fi.muni.cz.

Návaznosti

GF23-07040K, projekt VaV
Název: Naučené indexy pro podobností hledání
Investor: Grantová agentura ČR, Naučené indexy pro podobností hledání, Lead agentura
LM2023055, projekt VaV
Název: Česká národní infrastruktura pro biologická data
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, ELIXIR-CZ: Česká národní infrastruktura pro biologická data
MUNI/A/1590/2023, interní kód MU
Název: Využití technik umělé inteligence pro zpracování dat, komplexní analýzy a vizualizaci rozsáhlých dat
Investor: Masarykova univerzita, Využití technik umělé inteligence pro zpracování dat, komplexní analýzy a vizualizaci rozsáhlých dat
90254, velká výzkumná infrastruktura
Název: e-INFRA CZ II
Zobrazeno: 2. 11. 2024 23:35