Bakalářská práce

Random Forest. Anomaly detection story

Petr Matonoha, učo 485185
Anotace

V této práci se blíže podíváme na detekci odlehlých bodů pomocí náhodného lesa. Popíšeme úspěšné aplikace náhodného lesa, metodu a možné algoritmy pro použití náhodného lesa pro detekci odlehlých bodů. Dále přestavíme tři faktory odlehlosti a na jejich základě vytváříme nové faktory odlehlosti. Nakonec provedeme experimenty, abychom porovnali nové metody s již existujícími.

Abstract

In this work, we take a closer look at outlier detection using a random forest. We describe successful applications of the random forest, a method and possible algorithms for using the random forest for outlier detection. We introduce three outlier factors and based on them we create new outlier factors. Finally, we do experiments to compare new methods with already existing ones.

Zadání práce
Random Forest (RF) je jeden z nejúspěšnějších a nejvšestranějších algoritmů strojového učení. Popište jeho hlavní rysy a zaměřte se na použití RF pro detekci a analýzu anomálií. Stručně popište program RF-OEX a na jeho základě a na základě studia literatury navrhněte a ověřte nové faktory odlehlosti (OF), nejméně jeden vycházející z RF-OEX a neméně jeden na základě literatury. Porovnejte úspěšnost těchto nových OF s RF-OEX, CODB apod. jednak na datech s ground-truth jednak při filtrování anomálií před naučením klasifikátoru.
Práce zkontrolována:
28. 5. 2021 16:15, doc. RNDr. Lubomír Popelínský, Ph.D.
Plný text práce
532,5 KB / soubor PDF
Jazyk práce
angličtina angličtina
Termín obhajoby
2. 7. 2021
Práce byla úspěšně obhájena

Vedoucí

doc. RNDr. Lubomír Popelínský, Ph.D.
KSUZD FI MU

Oponent

RNDr. Karel Vaculík, Ph.D.
abs FI MU

Literatura

  • AGGARWAL, Charu C. Outlier analysis. New York: Springer, 2013, xv, 446. ISBN 9781461463955.

Masarykova univerzita Fakulta informatiky
Studijní program
Informatika
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.