标题:基于分层门控神经网络的长文本摘要相似度模型 作者:宋金洋 陈亮 作者单位:沈阳理工大学自动化与电气工程学院,辽宁 沈阳 110159 关键字:长文本相似度;BiLSTM;特征提取;余弦相似度;多头注意力 摘要:长文本特征抽取是语义理解和关键信息抽取领域的研究热点,如何从长文本中抽取有效信息并进行长文本之间的相似度计算一直是自然语言处理的主要研究方向之一。基于此,提出了一种基于分层门控神经网络的长文本摘要相似度模型。该模型主要分为两个部分:①基于BiLSTM的摘要生成,在BiLSTM模型的基础上加入多头注意力机制,使模型可以提取到更加深层次的特征;②基于摘要的文本相似度计算,将传统的相似度分类模型转变成回归模型,采用多层BiLSTM对生成的摘要进行特征提取并加入自适应因子作为门控,控制每层BiLSTM信息量的输出。实验结果表明该算法能够实现对长文本的特征提取,同时能够基于提取出的特征,利用余弦距离进行相似度比较。 |