x 2024

3DZD: Protein structural embeddings of ESM Atlas

NOVOTNÁ, Lucie; Terézia SLANINÁKOVÁ; David PROCHÁZKA; Lukáš HEJTMÁNEK; Adrián ROŠINEC et. al.

Základní údaje

Originální název

3DZD: Protein structural embeddings of ESM Atlas

Vydání

2024

Další údaje

Jazyk

angličtina

Typ výsledku

Projekty výzkumu a vývoje

Obor

10201 Computer sciences, information science, bioinformatics

Stát vydavatele

Česká republika

Utajení

není předmětem státního či obchodního tajemství

Odkazy

Organizační jednotka

Fakulta informatiky

Klíčová slova anglicky

protein structure; similarity search; AlphaFold; embeddings; AlphaFind

Příznaky

Mezinárodní význam
Změněno: 31. 3. 2025 09:41, Mgr. Eva Špillingová

Anotace

V originále

The dataset contains proteins from AlphaFold DB v4 (https://alphafold.ebi.ac.uk/) encoded into one-dimensional vectors (embeddings). The embeddings encode proteins by their tertiary structure. Additional information is available at our GitHub (https://github.com/Coda-Research-Group/ProteinEmbeddingBenchmark).

Návaznosti

GF23-07040K, projekt VaV
Název: Naučené indexy pro podobností hledání
Investor: Grantová agentura ČR, Naučené indexy pro podobností hledání, Lead agentura
LM2023055, projekt VaV
Název: Česká národní infrastruktura pro biologická data
Investor: Ministerstvo školství, mládeže a tělovýchovy ČR, ELIXIR-CZ: Česká národní infrastruktura pro biologická data
MUNI/A/1590/2023, interní kód MU
Název: Využití technik umělé inteligence pro zpracování dat, komplexní analýzy a vizualizaci rozsáhlých dat
Investor: Masarykova univerzita, Využití technik umělé inteligence pro zpracování dat, komplexní analýzy a vizualizaci rozsáhlých dat
752/2024, interní kód MU
Název: Nástroj na automatickou anotaci a prohledávání velkých sad proteinů na základě podobnosti jejich struktur
Investor: CESNET, Nástroj na automatickou anotaci a prohledávání velkých sad proteinů na základě podobnosti jejich struktur
90254, velká výzkumná infrastruktura
Název: e-INFRA CZ II