标题:基于多尺度滑动窗口自注意力网络的交互动作识别 作者:周琴1,2 周凡颖1,2 丁友东1,2 作者单位:1 上海大学上海电影学院,上海 200072;2 上海电影特效工程技术研究中心,上海 200072 关键字:交互动作识别;人机交互;多尺度;滑动窗口;深度学习 摘要:近年来交互式动作识别逐渐应用于人机交互领域,具有很强的经济价值。在之前的工作中,主要考虑了实体之间固定的物理连接,这种基于先验知识的方法忽略了实体的多样性。在此基础上,推出了一种基于滑动窗口分割考虑不同实体间交互的方法,虽然弥补了之前的实体多样性问题,却忽视了多尺度时空和实体的多尺度交互。提出了一种基于多尺度滑动窗口的自注意力Transformer网络方法,将输入数据按照多尺度窗口划分,并将划分好的数据进行融合,在自注意力网络中得到最终的分类结果。实验证明,按照多尺度窗口的划分方法,与其他方法相比具有更好的识别效果,并且在两种数据集上都达到了更好的识别效果。 |