KICO, Iris, Jan SEDMIDUBSKÝ a Pavel ZEZULA. Towards Efficient Human Action Retrieval based on Triplet-Loss Metric Learning. Online. In Strauss, C., Cuzzocrea, A., Kotsis, G., Tjoa, A.M., Khalil, I. 33rd International Conference on Database and Expert Systems Applications (DEXA). Berlin, Heidelberg: Springer-Verlag, 2022, s. 234-247. ISBN 978-3-031-12422-8. Dostupné z: https://dx.doi.org/10.1007/978-3-031-12423-5_18.
Další formáty:   BibTeX LaTeX RIS
Základní údaje
Originální název Towards Efficient Human Action Retrieval based on Triplet-Loss Metric Learning
Autoři KICO, Iris (70 Bosna a Hercegovina, domácí), Jan SEDMIDUBSKÝ (203 Česká republika, garant, domácí) a Pavel ZEZULA (203 Česká republika, domácí).
Vydání Berlin, Heidelberg, 33rd International Conference on Database and Expert Systems Applications (DEXA), od s. 234-247, 14 s. 2022.
Nakladatel Springer-Verlag
Další údaje
Originální jazyk angličtina
Typ výsledku Stať ve sborníku
Obor 10200 1.2 Computer and information sciences
Stát vydavatele Spojené státy
Utajení není předmětem státního či obchodního tajemství
Forma vydání elektronická verze "online"
WWW URL
Impakt faktor Impact factor: 0.402 v roce 2005
Kód RIV RIV/00216224:14330/22:00125807
Organizační jednotka Fakulta informatiky
ISBN 978-3-031-12422-8
ISSN 0302-9743
Doi http://dx.doi.org/10.1007/978-3-031-12423-5_18
UT WoS 000877013800018
Klíčová slova anglicky human motion data;skeleton sequences;action similarity;action retrieval;triplet-loss learning;LSTM
Štítky firank_B
Příznaky Mezinárodní význam, Recenzováno
Změnil Změnil: RNDr. Pavel Šmerk, Ph.D., učo 3880. Změněno: 28. 3. 2023 10:50.
Anotace
Recent pose-estimation methods enable digitization of human motion by extracting 3D skeleton sequences from ordinary video recordings. Such spatio-temporal skeleton representation offers attractive possibilities for a wide range of applications but, at the same time, requires effective and efficient content-based access to make the extracted data reusable. In this paper, we focus on content-based retrieval of pre-segmented skeleton sequences of human actions to identify the most similar ones to a query action. We mainly deal with the extraction of content-preserving action features, which are learned using the triplet-loss approach in an unsupervised way. Such features are (1) effective as they achieve a similar retrieval quality as the features learned in a supervised way, and (2) of a fixed size which enables the application of indexing structures for efficient retrieval.
Návaznosti
EF16_019/0000822, projekt VaVNázev: Centrum excelence pro kyberkriminalitu, kyberbezpečnost a ochranu kritických informačních infrastruktur
MUNI/A/1195/2021, interní kód MUNázev: Aplikovaný výzkum v oblastech vyhledávání, analýz a vizualizací rozsáhlých dat, zpracování přirozeného jazyka a aplikované umělé inteligence
Investor: Masarykova univerzita, Aplikovaný výzkum v oblastech vyhledávání, analýz a vizualizací rozsáhlých dat, zpracování přirozeného jazyka a aplikované umělé inteligence
VytisknoutZobrazeno: 23. 7. 2024 20:23