2014年度 第2期
标题:
改进的TF-IDF模型在特征抽取中的应用
作者:
李运田 吴琼 郑献卫
作者单位:
上海大学机电工程与自动化学院,上海 200072
关键字:
TF-IDF,N-gram,特征值
摘要:
在TF-IDF的基础上,提出了一种利用N-gram方法提取特征值的方法,能够很好的从一系列文本中取出某篇文本的特征值,并且可以对分词出现错误的一些连续的词语进行合并得到正确的一组词语,减少了分词出现的错误率。