标题:基于Jaccard算法的机器学习文本相似度检测 作者:戴振华 王凤梅 作者单位:湖南科技学院信息工程学院,湖南 永州 425199 关键字:Jaccard算法;机器学习;同义词转换;文本相似度 摘要:由于文本数据呈现爆炸性增长,文本相似度检测在大数据时代具有广泛的应用和意义,基于Jaccard算法的机器学习文本相似度检测,能更准确地检测文本相似度,并能够考虑到同义词、停用词等因素对计算结果的影响,这种算法在新闻摘要自动提取、文本去重、文本分类等场景中具有重要意义。该系统能够实现对于读取本地文本和手动输入文本的相似度检测,通过将多种算法结合,借助Python强大的开源库和工具,利用丰富的词库资源,可以提高文本相似度检测的精准度。 |