标题：基于多尺度通道注意力机制的人体姿态估计
作者：张含王瑞
作者单位：上海大学通信与信息工程学院，上海 200444
关键字：人体姿态估计；多尺度通道注意力；深度学习
摘要：人体姿态估计是当前的研究热点，可应用在动作识别、人机交互、医疗监护、运动分析、虚拟现实等方面。人体姿态估计主要从输入数据中获取人体的关键节点，比如肩膀、手肘、膝盖。鉴于现有深度学习算法在遮挡情况下存在识别不准确的情况，通过多尺度通道注意力机制对人体姿态估计的任务进行算法优化，核心思想是获取特征图的通道权重，聚合本地和全局特征的上下文信息。通过多个尺度自适应地融合通道维度的权重，实现对通道信息的加强，也就是选择性地增强重要特征和抑制无意义的特征。实验以SimpleBaseline为基准网络，插入多尺度通道注意力模块后，在MPII人体姿态数据集上进行训练和测试，达到88.402%的精度。实验在COCO数据集上进行训练和测试达到72.8的AP结果。