Bakalářská práce

Differentiating between identical nucleotide sequences using epigenetic information

Adam Michalík
Anotace

Moderné sekvenačné metódy, ako nanopórová sekvenácia, priniesli nové možnosti do oblasti genomiky. Jedna z týchto možností je získavanie epigenomických dát v obrovských množstvách. Vedecká komunita využíva tieto dáta voči ich potenciálu len veľmi zriedkavo. Táto bakalárska práca sa preto snaží využiť takéto dáta novým spôsobom, konkrétne na zhlukovanie genomických dát. Toto zhlukovanie môže byť využité …více

Abstract

Modern sequencing methods such as nanopore sequencing have brought new possibilities into the field of genomics. One of them is the opportunity to gather epigenetic data in massive amounts. However, this data is only occasionally taken advantage of in the scientific community, dampening its potential. This thesis tackles this lack of utilization with a new option to use the epigenetic information for …více

Zadání práce
The advent of next-generation sequencing and the era of complete genomics has brought us close to fully deciphering the human genome from ‘telomere to telomere’, as demonstrated by the growing body of scientific work, including the new human reference released by the T2T consortium. Yet, there are parts of the human genomes that are still prone to misassembly and mischaracterization, especially those that are duplicated and/or present many times in identical or nearly identical versions. Some of these sequences differ on an epigenetic level, e.g. by their methylation status. Traditionally, the differences in methylation can be detected by bisulfite sequencing, requiring additional sample processing and manipulation. Recently, long reads such as those by PacBio and Nanopore sequencing became capable of detecting these modifications. In the case of PacBio, this is achieved by detecting the altered polymerase dynamics, as the incorporation of methylated nucleotides takes longer during the sequencing process. In the case of Nanopore, methylated nucleotides alter the electrical signal when passing through the pore. The student will develop algorithms and approaches that are able to discriminate among (nearly) identical sequences based on their epigenetic profiles using long reads. Further, the student will use known published examples of such differences (e.g. for an active and inactive X chromosome) to demonstrate the performance of a proposed solution. Finally, this work will aid in the mapping and assembly of these complex regions.
Práce zkontrolována:
30. 5. 2022 15:11, Mgr. Monika Čechová, Ph.D., učo 256590
Jazyk práce
angličtina angličtina
Termín obhajoby
1. 7. 2022
Práce byla úspěšně obhájena

Vedoucí

Mgr. Monika Čechová, Ph.D., učo 256590
KSUZD FI MU

Oponent

Ing. Pavel Jedlička, Ph.D.

Masarykova univerzita Fakulta informatiky
Studijní program
Plán
Informatika
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.