标题:基于多段处理的软件缺陷预测 作者:杨昊天 黎敏 万齐康 邓雄狮 顾乾晖 作者单位:南昌工程学院信息工程学院,江西 南昌 330096 关键字:软件缺陷预测;不平衡数据;组合采样;特征选择;集成学习 摘要:软件缺陷预测对于有效地维护软件产品的高质量非常有用。在软件缺陷预测中,机器学习技术近年获得到了广泛的关注。实际应用中,有缺陷的软件样本大大少于无缺陷的软件样本,造成样本的高度不平衡。不平衡数据分类问题是数据挖掘与机器学习领域的研究热点与难点。为了有效解决软件缺陷预测问题中的类别不平衡问题,提出了一种基于多段处理的软件缺陷分类算法。在10个美国国家航空航天局(NASA)的软件缺陷数据集上的实验结果(F-measure、AUC)验证了该分类算法的优越性与有效性。 |