2013年度  第7期


标题:面向非平衡训练集分类的随机森林算法优化
作者:吴琼 李运田 郑献卫
作者单位:上海大学机电工程与自动化学院,上海 200072
关键字:数据挖掘,非平衡训练集,随机森林,NCL
摘要:数据挖掘是当今社会最活跃的研究方向之一,迄今为止数据挖掘技术已经广泛应用到各行各业中,然而在数据挖掘过程中往往会遇到很多非平衡训练集,采用传统的数据挖掘技术对非平衡训练集集进行处理不能得到理想的效果。主要是针对非平衡训练集,对数据进行NCL(Neighborhood Cleaning Rule)技术处理并结合随机森林(Random Forest)算法进行分类,试验结果表明,改进后的随机森林算法分类效果更好。