Diplomová práce

Predikce substrátové specificity haloalkan dehalogenáz s využitím strojového učení

Machine-learning based prediction of substrate specificity profiles for haloalkane dehalogenases

Bc. Michal Bubeník
Anotace

Tato práce se zabývá výpočetní predikcí substrátové specificity enzymů z rodiny haloalkan dehalogenáz, které mají řadu biotechnologických aplikací. Motivací je identifikace nových enzymů z této rodiny screeningem několika tisíc kandidátních sekvencí z databáze a aplikací připravených prediktorů na tyto sekvence, což je postup, který není možné provést experimentálně. Práce vychází ze změřených dat …více

Abstract

This thesis deals with the computational prediction of substrate specificity of enzymes from the haloalkane dehalogenase family, which are of numerous biotechnological applications. The motivation is to identify new enzymes from this family by screening several thousand candidate sequences from a database and applying the prepared predictors to these sequences, as such a procedure could not be performed …více

Zadání práce
Enzymatic activity profiles are the result of many factors defined by both the enzyme and substrate in question. We recently collected a large amount of activity data for dozens of haloalkane dehalogenases--enzymes with great potential for biodegradation toxic compounds. The goal of this diploma thesis is to explore the potential of using machine learning for predicting activity profiles for new haloalkane dehalogenases based on the substrate molecular features and enzyme sequence-based features.

The graduate will solve the following specific tasks:
- study of problems and literature search in the field of enzyme engineering and machine learning,
- generation of features for enzymatic reactions for substrates and enzymes used in the experiments,
- training of machine-learning based predictors and analysis of their output and predictive power.

To solve the practical part of the diploma thesis, the student will use the Python environment and scikit-learn library.

The thesis will be written in English.

Recommended literature:
- Yang M, Fehl C, Lees KV, Lim EK, Offen WA, Davies GJ, Bowles DJ, Davidson MG, Roberts SJ, Davis BG. Functional and informatics analysis enables glycosyltransferase activity prediction. Nature chemical biology. 2018.
- Buryska T, Vasina M, Gielen F, Vanacek P, van Vliet L, Jezek J, Pilat Z, Zemanek P, Damborsky J, Hollfelder F, Prokop Z. Controlled Oil/Water Partitioning of Hydrophobic Substrates Extending the Bioanalytical Applications of Droplet-Based Microfluidics. Analytical chemistry. 2019.
- Marsland S. Machine learning: an algorithmic perspective. CRC Press; 2009.
Práce zkontrolována:
16. 5. 2022 13:58, Stanislav Mazurenko, PhD, učo 235907
Jazyk práce
angličtina angličtina
Termín obhajoby
13. 6. 2022
Práce byla úspěšně obhájena

Vedoucí

Stanislav Mazurenko, PhD, učo 235907
ArtInt ProtIng RECETOX PřF MU

Oponent

Ing. Miloš Musil, Ph.D.
VUT v Brně, Fakulta informačních technologií, Ústav informačních systémů

Konzultant

prof. RNDr. Zbyněk Prokop, Ph.D., učo 23696
Kinet ProtIng RECETOX PřF MU

  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.