D 2019

Augmenting Spatio-Temporal Human Motion Data for Effective 3D Action Recognition

SEDMIDUBSKÝ, Jan a Pavel ZEZULA

Základní údaje

Originální název

Augmenting Spatio-Temporal Human Motion Data for Effective 3D Action Recognition

Autoři

SEDMIDUBSKÝ, Jan (203 Česká republika, garant, domácí) a Pavel ZEZULA (203 Česká republika, domácí)

Vydání

Neuveden, 21st IEEE International Symposium on Multimedia (ISM), od s. 204-207, 4 s. 2019

Nakladatel

IEEE Computer Society

Další údaje

Jazyk

angličtina

Typ výsledku

Stať ve sborníku

Obor

10200 1.2 Computer and information sciences

Utajení

není předmětem státního či obchodního tajemství

Forma vydání

elektronická verze "online"

Kód RIV

RIV/00216224:14330/19:00107708

Organizační jednotka

Fakulta informatiky

ISBN

978-1-72815-606-4

UT WoS

000528909200033

Klíčová slova anglicky

3D skeleton sequence;multimedia data;data augmentation;action recognition;bidirectional LSTM

Štítky

Příznaky

Mezinárodní význam, Recenzováno
Změněno: 12. 5. 2020 23:41, RNDr. Pavel Šmerk, Ph.D.

Anotace

V originále

Action recognition is a fundamental operation in 3D human motion analysis. Existing deep learning classifiers achieve a high recognition accuracy if large amounts of training data are provided. However, such data are difficult to obtain in a variety of application scenarios, mainly due to the high costs of motion capture technologies and an absence of suitable actors. In this paper, we propose augmentation techniques to artificially enlarge existing collections of 3D human skeleton sequences. The proposed techniques are especially useful for datasets distinguishing in a high number of classes, each of them characterized by only a limited number of action samples. We experimentally demonstrate that the augmented data help to significantly increase the recognition accuracy even using a standard deep learning architecture.

Návaznosti

GA19-02033S, projekt VaV
Název: Vyhledávání, analytika a anotace datových toků lidských pohybů
Investor: Grantová agentura ČR, Searching, Mining, and Annotating Human Motion Streams