2015年度  第2期


标题:烟草企业基于Hadoop的数据处理研究
作者:李铖瀚 何利力 刘淳猛
作者单位:浙江理工大学信息学院,浙江 杭州 310012
关键字:Hadoop,MapReduce,海量数据
摘要:Hadoop是一个开源分布式计算平台。具有高容错性,高伸缩性等优点,允许用户将Hadoop部署在低廉的PC上,充分利用集群的计算和存储能力,完成海量数据的处理。结合国内烟草企业面对不断剧增的业务数据,而现有的业务数据处理能力明显不足的现状,分析烟草企业构建Hadoop分布式数据处理平台的可行性,并详细介绍了Hadoop平台技术及其项目结构和体系结构。