Diplomová práce

Categorizing and visualizing the Dark Web

Bc. Linda Hansliková
Anotace

Online svět přístupný běžným způsobem se skládá z většinou legálních, vzájemně propojených webů a stránek. Struktura dark webu se však může lišit kvůli charakteru této skryté části internetu. Vyvstávají otázky o propojení a kategorickém složení obsahu dark webu. Pro část dark webu jsme na tyto otázky chtěli najít odpovědi. K výsledkům naší práce patří klasifikační model, který kategorizuje stránky …více

Abstract

The ordinarily accessible online world is composed of commonly legal, interlinked sites and pages. The structure of the dark web, however, may be different because of the nature of this hidden part of the Internet. Questions about the interconnection and the categorical makeup of the dark web content arise. We were interested in answering these questions for a portion of the dark web. The results …více

Zadání práce
The goal of this thesis is to categorize and visualise collected information about the dark web. More specifically, the student will:
* Create a backend for the retrieval of data from the database and further modification of the information
* Research modern text categorization algorithms and apply the selected one to categorize the collected pages
* Reduce the number of nodes so that it is possible to display them in a comprehensive way, e.g. divide them into groups or subgroups
* Research ways how pages or groups can be grouped together and build a graph of links between groups or pages
* Create API endpoints for the acquisition of:
   * groups or pages
   * a particular page
   * page/group further information (such as all links or all group members)
* Provide a UI for viewing the data, the user should be able to:
   * filter pages either by their URLs or content
   * observe the graph as a whole and zoom in and out individual groups
   * observe the categories of groups or pages
   * view details of groups and pages, such as categories, links, and page URL

Literature:
Vincent Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre. Fast Unfolding of Communities in Large Networks
David M. Blei, Andrew Y. Ng, Michael I. Jordan. Latent Dirichlet Allocation
Práce zkontrolována:
25. 5. 2020 16:25, RNDr. Martin Stehlík, Ph.D.
Jazyk práce
angličtina angličtina
Termín obhajoby
17. 6. 2020
Práce byla úspěšně obhájena

Vedoucí

RNDr. Martin Stehlík, Ph.D.
abs FI MU

Oponent

RNDr. Lukáš Němec, Ph.D., učo 394036
KPSK FI MU

Masarykova univerzita Fakulta informatiky
Studijní program
Aplikovaná informatika
Obor
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.