2016年度  第4期


标题:基于MapReduce的朴素贝叶斯文本分类研究
作者:严嘉铭 黄理灿
作者单位:浙江理工大学信息学院,浙江 杭州 310018
关键字:Hadoop,MapReduce,文本分类,贝叶斯分类
摘要:随着互联网的到来,其技术的发展导致了各种数据呈现出爆发式的增长,比如文本数据,分类算法在海量数据前面临着新的挑战。为了解决传统朴素贝叶斯分类算法在面临挑战中的不足,对其中关键词进行加权来提高分类准确率,然后通过MapReduce编程模型,设计出朴素贝叶斯算法在Hadoop平台下的实现。实验表明:在Hadoop集群上通过并行化的设计朴素贝叶斯分类算法展现出了良好的性能,同时表现出了可靠的扩展性。