Bakalářská práce
Získaná ocenění: Cena děkana FI za vynikající závěrečnou práci

Implementation of a Web Application for Protein Similarity Search the AlphaFold Database

Jakub Čillík, učo 524749
Anotace

V posledných rokoch, s nárastom pokroku v oblasti strojového učenia a integrácie výpočtových metód pri odhaľovaní proteínových štruktúr, ktoré sú umožnené inováciami ako AlphaFold, sa množstvo dostupných dát o štruktúrach proteínov rapídne zvýšilo. Pri vyhľadávaní v tomto rozsiahlom objeme molekulárnych dát vznikajú problémy týkajúce sa rýchlosti a prístupnosti pre používateľov. Táto bakalárska práca …více

Abstract

In the past few years, with the surge in machine learning advancements and the integration of computational methods in unraveling protein structures, exemplified by innovations like AlphaFold, the amount of available protein structure data has increased rapidly. When searching within this vast landscape of molecular data, challenges related to performance and user accessibility arise. The thesis introduces …více

Zadání práce
Efficient and effective searching in protein data presents a unique challenge due to their complex and unsortable nature. Many sequence-based search methods exist, but by definition lack information about 3D spatial arrangements (structures) that are crucial in understanding a protein's function. Addressing this challenge is important in advancing biological research, which relies on identifying similar protein structures, hence their biological functions, which may e.g. lead to better intuition on how different proteins react to different drug treatments. Similarity searching therefore emerges as a practical way of defining and addressing the problem, enabling the comparison of proteins based on their structural characteristics. The creation of AlphaFold 2 and subsequent open-sourcing of the AlphaFold database revolutionized the field of structural biology. With 214M protein structures, AlphaFold DB is the second-largest protein database in the world containing a wealth of information waiting to be scientifically used. However, there is currently no tool enabling structural similarity search in AlphaFold DB. This thesis aims to contribute to the scientific community by implementing a modern web application search engine for similarity searching in protein structures in the AlphaFold Database. In its creation, the student will: 1) study relevant literature and understand proteins, their biological importance, and their digital processing, 2) Analyze similar search applications and propose functional and non-functional requirements 3) Design and implement the application 4) Incorporate third-party software tools such as molecular dynamics graphics for visualization and AlphaFold DB's metadata to the application. Throughout the process, the student will communicate with domain experts from structural biology, gather their feedback, and incorporate it into the application. In adherence to open science principles, the application will be free to use, without the need to register or log in and its code will be open-source. The application will communicate with a similarity searching backend through API. Understanding the application's potential, the application will be considered for submission to a biology-oriented journal.
Práce zkontrolována:
24. 5. 2024 09:49, RNDr. Terézia Slanináková, Ph.D., učo 445526
Jazyk práce
angličtina angličtina
Termín obhajoby
25. 6. 2024
Práce byla úspěšně obhájena

Vedoucí

RNDr. Terézia Slanináková, Ph.D., učo 445526
KSUZD FI MU

Oponent

Mgr. Peter Balčirák
BDI DITI ÚVT MU

Konzultanti

RNDr. Matej Antol, Ph.D., učo 325040
KSUZD FI MU
Mgr. Adrián Rošinec, učo 469240
NCBR PřF MU

  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.