2021年度  第10期


标题:算法硬件协同设计的人脸识别加速器
作者:王浩 曹姗 徐树公
作者单位:上海大学通信与信息工程学院,上海 200444
关键字:卷积神经网络;人脸识别;现场可编程逻辑门阵列
摘要:近年来,随着卷积神经网络的发展,人脸识别算法的精度不断提升,但是由于卷积神经网络的参数量和计算量特别大,一般的嵌入式设备很难达到实时的人脸识别的效果,因此嵌入式端的人脸识别加速器变得尤为重要。从算法和硬件两个方面设计人脸识别加速器,算法上,对人脸识别网络的结构做了优化,探索更加适合在FPGA加速的卷积神经网络结构,并对卷积核尺寸、特征图尺寸、下采样方式和损失函数进行优化,提出了高精度的轻量型人脸识别网络VIPLiteNet;硬件上,针对特定的优化算法,在现场可编程逻辑门阵列上设计了专用的硬件架构,包括多级流水的高吞吐卷积计算阵列、高带宽的参数缓存器和高效的数据调度模块,并通过层融合方案进一步简化硬件计算。通过算法硬件协同设计的人脸识别加速器,可以在LFW数据集上取得99.05%的识别精度,在赛灵思ZYNQ ZCU102上识别一张人脸仅需1.8ms。