2020年度  第8期


标题:基于LSTM神经网络的语音情绪识别
作者:辛创业 许芬
作者单位:北方工业大学,北京 100144
关键字:情绪识别;长短时记忆神经网络;梅尔倒谱系数
摘要:随着人工智能的发展,人机交互技术在不断进步,为使人机交互更加友好,情绪识别技术被广泛关注。情绪是一个人内心的感触的体现,可以体现在面部、语音、脉搏等多方面。实验室环境中的语音识别技术取得了较好的效果,而现实场景的语言情绪识别技术仍不成熟,使用基于现实场景的CHEAVD2.0情感数据库进行实验。在对音频信息进行预处理后,进行音频特征的提取,提取了梅尔倒谱系数、短时过零率、基音周期和频率等特征。为抓取音频数据在时间维上的关联性,使用长短时记忆网络的方法进行情绪识别分类任务。