SEDMIDUBSKÝ, Jan, Fabio CARRARA a Giuseppe AMATO. SegmentCodeList: Unsupervised Representation Learning for Human Skeleton Data Retrieval. Online. In 45th European Conference on Information Retrieval (ECIR). Cham: Springer, 2023, s. 110-124. ISBN 978-3-031-28237-9. Dostupné z: https://dx.doi.org/10.1007/978-3-031-28238-6_8.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název SegmentCodeList: Unsupervised Representation Learning for Human Skeleton Data Retrieval
Autoři SEDMIDUBSKÝ, Jan (203 Česká republika, garant, domácí), Fabio CARRARA a Giuseppe AMATO.
Vydání Cham, 45th European Conference on Information Retrieval (ECIR), od s. 110-124, 15 s. 2023.
Nakladatel Springer
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Česká republika
Utajení není předmětem státního či obchodního tajemství
Forma vydání elektronická verze "online"
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/23:00130177
Organizační jednotka Fakulta informatiky
ISBN 978-3-031-28237-9
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-031-28238-6_8
UT WoS 000995489700008
Klíčová slova anglicky 3D skeleton sequence;segment similarity;unsupervised feature learning;Variational AutoEncoder;segment code list;action retrieval
Štítky DISA
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 7. 4. 2024 22:39.
Anotace
Recent progress in pose-estimation methods enables the extraction of sufficiently-precise 3D human skeleton data from ordinary videos, which offers great opportunities for a wide range of applications. However, such spatio-temporal data are typically extracted in the form of a continuous skeleton sequence without any information about semantic segmentation or annotation. To make the extracted data reusable for further processing, there is a need to access them based on their content. In this paper, we introduce a universal retrieval approach that compares any two skeleton sequences based on temporal order and similarities of their underlying segments. The similarity of segments is determined by their content-preserving low-dimensional code representation that is learned using the Variational AutoEncoder principle in an unsupervised way. The quality of the proposed representation is validated in retrieval and classification scenarios; our proposal outperforms the state-of-the-art approaches in effectiveness and reaches speed-ups up to 64x on common skeleton sequence datasets.
Návaznosti
EF16_019/0000822, projekt VaVNázev: Centrum excelence pro kyberkriminalitu, kyberbezpečnost a ochranu kritických informačních infrastruktur
VytisknoutZobrazeno: 21. 7. 2024 19:31