D 2025

Advancing the PAM Algorithm to Semi-Supervised k-Medoids Clustering

JÁNOŠOVÁ, Miriama; Andreas LANG; Petra BUDÍKOVÁ; Erich SCHUBERT; Vlastislav DOHNAL et. al.

Základní údaje

Originální název

Advancing the PAM Algorithm to Semi-Supervised k-Medoids Clustering

Autoři

JÁNOŠOVÁ, Miriama (703 Slovensko, domácí); Andreas LANG (276 Německo); Petra BUDÍKOVÁ (203 Česká republika, domácí); Erich SCHUBERT (276 Německo) a Vlastislav DOHNAL (203 Česká republika, garant, domácí)

Vydání

Cham, 17th International Conference on Similarity Search and Applications (SISAP), od s. 223-237, 15 s. 2025

Nakladatel

Springer

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Stát vydavatele

Švýcarsko

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

tištěná verze "print"

Odkazy

Organizační jednotka

Fakulta informatiky

ISBN

978-3-031-75822-5

Klíčová slova anglicky

semi-supervised clustering;k-medoids;partitioning around medoids;FasterPAM;semi-supervised classification;DISA;LMI

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 21. 3. 2025 17:36, doc. RNDr. Vlastislav Dohnal, Ph.D.

Anotace

V originále

The analysis of complex, weakly labeled data is increasingly popular, presenting unique challenges. Traditional unsupervised clustering aims to uncover interrelated sets of objects using feature-based similarity of the objects, but this approach often hits its limits for complex multimedia data. Thus, semi-supervised clustering that exploits small amounts of labeled training data has gained traction recently. % In this paper, we propose LabeledPAM, a semi-supervised extension of FasterPAM, a state-of-the-art k-medoids clustering algorithm. Our approach is applicable in semi-supervised classification tasks, where labels are assigned to clusters with minimal labeled data, as well as in semi-supervised clustering scenarios, identifying new clusters with unknown labels. We evaluate our proposal against other semi-supervised clustering techniques suitable for arbitrary distances, demonstrating its efficacy and versatility.

Návaznosti

GF23-07040K, projekt VaV
Název: Naučené indexy pro podobností hledání
Investor: Grantová agentura ČR, Naučené indexy pro podobností hledání, Lead agentura
MUNI/A/1590/2023, interní kód MU
Název: Využití technik umělé inteligence pro zpracování dat, komplexní analýzy a vizualizaci rozsáhlých dat
Investor: Masarykova univerzita, Využití technik umělé inteligence pro zpracování dat, komplexní analýzy a vizualizaci rozsáhlých dat
MUNI/A/1638/2024, interní kód MU
Název: Umělá inteligence a správa komplexních rozsáhlých dat
Investor: Masarykova univerzita, Umělá inteligence a správa komplexních rozsáhlých dat
90254, velká výzkumná infrastruktura
Název: e-INFRA CZ II

Přiložené soubory

Labelled_PAM___final.pdf
Požádat o autorskou verzi souboru