2024年度  第8期


标题:轻量化端到端语音指令识别模型研究
作者:黄晁 赵忆 张从连 袁敏杰 陈春燕
作者单位:宁波中科信息技术应用研究院(宁波人工智能产业研究院),浙江 宁波 315040
关键字:语音指令识别;端到端;轻量化;连接时序分类算法
摘要:针对智能家居中小词表语音指令识别应用场景的模型小尺寸和低延时的需求,设计了两种轻量化的基于神经网络和连接时序分类算法(CTC)的中文端到端语音指令识别模型。通过精简网络层数和结构实现模型轻量化,引入CTC算法实现以汉字字符作为建模基元的端到端训练和解码,解决数据预对齐问题。最终在公开数据集Aishell-I和自制语料数据集上进行比较,最终得出CNN-CTC模型以350 kB的模型大小、5 ms的运行速度、5.02%的字错率、92.0%的意图命中率综合评价后,更适用于小词表语音指令识别应用场景。