2017年度  第11期


标题:中文文本特征选择方法研究综述
作者:徐泓洋 杨国为
作者单位:青岛大学电子信息学院,山东 青岛 266071
关键字:文本分类,情感分析,特征选择
摘要:针对文本的分析研究中,根据分析目标的不同可归纳为文本分类和情感分析两种类型,在某些情况下,情感分析也可以被看作是一种特殊的文本分类问题。文本分类的一大特征是过高的向量维数,因此特征降维是文本分类的一大核心问题,而特征选择是特征降维的核心技术之一。归纳总结了中文文本分类和情感分析中常见的特征选择方法,分析各种方法的原理,指出其优缺点,并总结近年来相应算法改进情况。