2018年度  第4期


标题:基于TF-IDF特征提取的短文本分类方法描的方法
作者:曹姗
作者单位:浙江理工大学理学院,浙江 杭州 310018
关键字:短文本分类,TF-IDF,特征提取,权重
摘要:大量的文本数据管理和挖掘通常依赖于自动文本分类技术。训练集是文本分类中的一个基本问题,直接影响分类准确性。针对传统短文本分类方法依赖于外部资源的问题,提出一种基于TF-IDF特征提取的短文本分类方法。该方法通过增强文本特征向量权重的方式,从而能在保证文本特征表达效果的前提下大幅提升算法性能。