Závěrečná práce: Vladimír Míč, učo 359890: Hierarchické shlukování rozsáhlých množin vektorových dat
Bakalářská práce
Hierarchické shlukování rozsáhlých množin vektorových dat
Hierarchical Clustering of Large Sets of Vector Data
Vladimír Míč, učo 359890
Anotace
Cílem práce bylo implementovat vybrané algoritmy hierarchického a nehierarchického shlukování množin vektorů. Tyto metody jsou porovnány s náhodným výběrem centroidů z datové množiny. Program je schopen zpracovávat velmi rozsáhlé množiny dat. Textová část obsahuje popis vybraných shlukovacích metod a odevzdanou implementaci.
Abstract
The aim of the thesis was to implement chosen cluster analysis methods. These methods are compared with a random selection of centroids from a clustered set. Algorithms are able to analyze very big datasets. Thesis contains description of chosen methods and its implementation.
Zadání práce
Student nastuduje a v jazyce Java implementuje vybrané algoritmy hierarchického a nehierarchického shlukování množin vektorů. Při implementaci využije ve vhodné míře knihovnu MESSIF. Metody musí být schopny zpracovat velmi rozsáhlé vstupní množiny, tedy množiny obsahující řádově desítky milionů vektorů. Student též implementované metody porovná s náhodným výběrem centroidů z datové množiny. Výsledná zpráva bude obsahovat popis zvolených algoritmů a jejich srovnání po stránce kvalitativní (kompaktnost vzniklých clusterů, možnost ovlivnění počtu vzniklých clusterů, možnost určení váhy clusterovaných dat, popř. další, studentem zvolená kritéria) a výkonnostní (možnosti paralelizace, rychlost zpracování). Srovnání metod se bude opírat o výsledky praktických experimentů.
Práce zkontrolována:
18. 5. 2012 08:36, RNDr. Tomáš Homola, Ph.D.
18. 5. 2012 08:36, RNDr. Tomáš Homola, Ph.D.
- Zadáno/změněno 25. 6. 2012 08:30, Eva Drštková
- Záznam založen 24. 4. 2012 11:06, Alena Dvořáková
- Zveřejnit od 17. 5. 2012 11:11, Alena Dvořáková
- Práce převzata 17. 5. 2012 11:11, Alena Dvořáková
Přílohy
Jazyk práce
Termín obhajoby
22. 6. 2012
Práce byla úspěšně obhájena
Vedoucí
RNDr. Tomáš Homola, Ph.D.
abs FI MU
abs FI MU
Konzultant
Studijní program
Informatika
Práce na příbuzné téma
Seznam prací, které mají shodná klíčová slova.
-
Vyhledávání podobných obrázků tetování
Bc. Petr Hájek, učo 256613 -
Statistická analýza vývoje střevního mikrobiomu v prvním roce života
Mgr. Lucie Chládková, učo 474241 -
Metrický prostor spojitých funkcí: teorie a aplikace
Mgr. Filip Svoboda -
Algoritmus pro počítání vzdáleností konvexních množin
Mgr. Jakub Klejch -
Metrické úlohy - konstrukční a analytické řešení
Mgr. Veronika Cejpková -
Clustering of Mobile Devices Based on Their Security State
Mgr. Dáša Pawlasová -
Multiresolution exploration of spatial transcriptomics data
Bc. Lucia Koštialová, učo 505841 -
Aplikace shlukovacích metod na data klinických registrů
Mgr. Bc. Hana Zelinková, učo 208192
Název
Vložil
Vloženo
Práva
Archiv závěrečné práce Vladimír Míč FI B-IN MI, učo 359890 s1wgw/13
Dvořáková, A.
24. 4. 2012
Složky
Soubory
15. 5. 2012




