2018年度  第9期


标题:基于云平台大数据的迁移与研究
作者:陈鹤元 彭章友
作者单位:上海大学信息与通信学院,上海 201900
关键字:数据查询,数据迁移,HBase
摘要:在互联网高速发展的时代,面对数据量的爆炸式增长,通过现有的数据迁移存储系统可以完成大数据量的迁移存储任务但是效率还是较低。尤其是通过对表中数据计数和基于Value值这两种方法查询时整合后的效率要远低于单独使用Hive的查询效率,远不能满足企业数据处理方面的需求。所以对于通过对表中数据计数和基于Value值这两种查询方法的效率还有提升的空间。在对表中数据计数和基于Value值两种数据查询方式进行了优化,主要使用为HBase表分配Region以及设置caching的方法。通过测试得到证明,以上两种查询方式得到了极大优化。主要针对于基于Hadoop平台迁移与查询的性能优化问题。在完成千万条以上数据量的迁移存储时,通过优化查询性能完善了数据存储方面的功能,给企业带来了更为便捷、高效的数据管理服务。