Prediction of missing peaks in mass spectra

Starý, Michal

Bakalářská práce

Cena děkana FI za vynikající závěrečnou práci

Prediction of missing peaks in mass spectra

Michal Starý

Anotace

Identifikace sloučenin je zásadní pro monitorování životního prostředí. Plynová chromatografie s hmotnostní spektrometrií (GC-MS) je široce používanou metodou pro tuto identifikaci. Klíčovým krokem ve zpracování komplexních dat pocházejících z GC-MS přístroje je detekce vrcholů. Chyby algoritmů detekce vrcholů, jako jsou například nezachycené vrcholy, značně omezují schopnost výzkumníků monitorovat …víceméně

Abstract

Compound identification is essential for monitoring the environment. Gas Chromatography-Mass Spectrometry (GC-MS) is a widely used method for such identification. A crucial step in the processing of complex data coming from the physical GC-MS instrument is peak detection. The errors of peak detection algorithms, such as missed peaks, severely limit the researchers' ability to monitor low-concentration …víceméně

Klíčová slova

machine learning deep learning neural networks mass spectrometry gas chromatography GC-MS peak detection transformers LSTM

Zadání práce

Mass spectrometry is an important analytical technique used in laboratories to elucidate composition of unknown samples. Data analysis of the signal coming from a mass spectrometer is a complicated multi-step process. In the ultimate phase of this process, the mass spectra of individual compounds are recovered and compared to a spectral database of known compounds.

Formally, the mass spectrum of a single compound can be represented as a smaller (cardinality ranging from tens to low hundreds) set of pairs (mass, intensity). Due to various factors (such as imperfect deconvolution, noise, etc.), it may happen that some of those pairs are missing. As a result, the precision of database retrieval declines.

The goal of this work is to apply machine learning methods (with a particular focus on deep learning methods coming from the natural language processing area) in such a way that they can suggest what are the missing parts. With this kind of advice, it will be possible to confirm or disprove the presence of the signal in original data and to improve the precision of database retrieval significantly.

Twofold focus of the work is expected. Firstly, the prediction of peaks with a lower intensity (that are often obscured by noise in measured data) will be addressed. Secondly, the correction of (deconvolution, ...) errors caused by an overlap of different compounds and expressed as randomly missing peaks even in higher intensity sections in measured data should be targeted.

The output of the work should be methods implemented in a suitable form (e.g Jupyter notebooks, R-Studio), evaluation of those on the dataset available and discussion of the results achieved.

Administrativní informace

Práce zkontrolována:
17. 12. 2021 16:25, Mgr. Aleš Křenek, Ph.D., učo 3086

Zadáno/změněno 11. 2. 2022 08:20, Miroslava Tomíčková, učo 114718
Záznam založen 26. 11. 2021 08:42, Jana Zemanová, učo 9619
Zveřejnit od 16. 12. 2021 11:51, Lucie Wagnerová, učo 119715
Práce převzata 16. 12. 2021 11:51, Lucie Wagnerová, učo 119715

Plný text práce

2,9 MB / soubor PDF

Přílohy (1)

Přílohy

project.zip

Příloha

Jazyk práce

angličtina

Termín obhajoby

10. 2. 2022

Práce byla úspěšně obhájena

Vedoucí

Mgr. Aleš Křenek, Ph.D., učo 3086
ANKO DITI ÚVT MU

Posudek vedoucího

Oponent

doc. Mgr. Bc. Vít Nováček, PhD, učo 4049
KSUZD FI MU

Posudek oponenta

Citovat tuto práci

Citace dle normy ČSN ISO 690

STARÝ, Michal. Prediction of missing peaks in mass spectra. Online. Bakalářská práce. Brno: Masarykova univerzita, Fakulta informatiky. 2022. Dostupné z: https://is.muni.cz/th/dz62r/.

@misc{Stary2022thesis, AUTHOR = {Starý, Michal}, TITLE = {Prediction of missing peaks in mass spectra}, YEAR = {2022}, TYPE = {Bakalářská práce}, INSTITUTION = {Masarykova univerzita, Fakulta informatiky}, LOCATION = {Brno}, SUPERVISOR = {Aleš Křenek}, URL = {https://is.muni.cz/th/dz62r/}, URL_DATE = {2026-07-02}, }

{{Citace kvalifikační práce | příjmení = Starý | jméno = Michal | instituce = Masarykova univerzita, Fakulta informatiky | odkaz na instituci = Fakulta informatiky Masarykovy univerzity | titul = Prediction of missing peaks in mass spectra | url = https://is.muni.cz/th/dz62r/ | typ práce = Bakalářská práce | vedoucí = Aleš Křenek | odkaz na vedoucího = {{UČO na článek|3086}} | místo = Brno | rok = 2022 | počet stran = | strany = | citace = 2026-07-02 | poznámka = | jazyk = en }}

Masarykova univerzita Fakulta informatiky

Studijní program

Informatika

Obor

Umělá inteligence a zpracování přirozeného jazyka

Práce na příbuzné téma

Seznam prací, které mají shodná klíčová slova.

Fast object detection on mobile platforms using neural networks

Mgr. Tomáš Repák
Synthesis of microscopy images using neural networks

Bc. Martin Kozlovský
Automatic text summarization

Mgr. Adam Hájek
Mining Czech Clinical Notes Using the Language Modelling Technology

Mgr. Tomáš Houfek
Smart Picture Enlargement Using Neural Networks

Ing. Michal Čaniga
Forecasting of successful verbal memory encoding in humans from intracranial EEG

Mgr. Patrik Begáň
Basket opce

Mgr. Tomáš Ličák
Pathological Image Analysis Using Attention Based Deep Learning Methods

Ing. Petr Kantek, B.Sc.

Podobné práce

Název

Vložil

Vloženo

Práva

Archiv závěrečné práce Michal Starý FI B-IN UMI dz62r/7

Zemanová, J.

26. 11. 2021

Složky

Soubory

Anotace anglicky annotation_english.txt

Starý, M.

15. 12. 2021

Anotace česky annotation.txt

Starý, M.

15. 12. 2021

Klíčová slova keywords.txt

Starý, M.

15. 12. 2021

Plný text práce THESIS.pdf

Starý, M.

15. 12. 2021

Posudek oponenta posudek_oponenta_Novacek.pdf

Nováček, V.

28. 1. 2022

Posudek vedoucího posudek_vedouciho_Krenek.pdf

Křenek, A.

27. 1. 2022

Příloha project.zip

Starý, M.

15. 12. 2021

Přidání souboru

Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
Další operace se soubory

Podrobnosti lze zjistit označením příslušného řádku.
Pohled pro experty

Pro častou práci je možné zvolit režim Více možností.
Vyhledávání souborů

Vyhledávaný výraz můžete zadat přímo do adresního řádku.
Rychlý přístup k souborům

Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.

Závěrečná práce: Michal Starý: Prediction of missing peaks in mass spectra

Bakalářská práce

Prediction of missing peaks in mass spectra

Anotace

Abstract

Klíčová slova

Zadání práce

Přílohy

project.zip

Vedoucí

Oponent

Citace dle normy ČSN ISO 690

Práce na příbuzné téma

Složky

Soubory

Přidání souboru

Další operace se soubory

Pohled pro experty

Vyhledávání souborů

Rychlý přístup k souborům