基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,软件缺陷预测的研究引起了大量关注.软件缺陷预测中普遍存在类别不平衡问题,即有缺陷样本要远少于无缺陷样本,而有缺陷样本又是预测的重点.上述问题使得缺陷预测模型的性能难以满足用户要求,有必要对不平衡数据进行有效处理.目前,采样法和集成学习方法已成为处理不平衡数据的2类重要方法,很多学者提出了不同的过采样方法和集成学习方法.本文研究如何把这2类方法更好地组合在一起,从而有效地处理缺陷预测中的类别不平衡问题.对此,选取RandomOverSampler、SMOTE、Borderline-SMOTE和ADASYN这4种常见的过采样方法以及Bagging、Ran-dom Forest、AdaBoost和GBDT这4种常用的集成学习方法,分别将一种过采样方法与一种集成方法组合在一起,从而形成不同的组合.通过对比每一种组合的缺陷预测性能,从而获得最优组合,为缺陷预测中不平衡问题的处理提供有益参考.实验表明,过采样方法ADASYN在处理不平衡问题方面更有优势,它与集成方法GBDT的组合表现最优,相对于其他组合具有更好的缺陷预测性能.
推荐文章
基于集成混合采样的软件缺陷预测研究
不平衡数据
SMOTE
K-Means
投票
集成学习
基于多核集成学习的跨项目软件缺陷预测
跨项目缺陷预测
多核学习
集成学习
代价敏感学习
有监督学习
基于局部稀疏重构度量学习的软件缺陷预测
度量学习
软件缺陷预测
稀疏表示
局部信息
鉴别性
增加度量元的迁移学习跨项目软件缺陷预测
跨项目
机器学习
软件缺陷预测
迁移学习
分类器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 过采样与集成学习方法在软件缺陷预测中的对比研究
来源期刊 计算机与现代化 学科 工学
关键词 缺陷预测 类别不平衡 过采样 集成学习
年,卷(期) 2020,(6) 所属期刊栏目 数据挖掘
研究方向 页码范围 83-88
页数 6页 分类号 TP391
字数 5195字 语种 中文
DOI 10.3969/j.issn.1006-2475.2020.06.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜军威 青岛科技大学信息科学技术学院 50 341 9.0 17.0
2 江峰 青岛科技大学信息科学技术学院 31 263 8.0 15.0
3 王海 青岛科技大学信息科学技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (64)
共引文献  (21)
参考文献  (16)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(2)
  • 参考文献(2)
  • 二级参考文献(0)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(5)
  • 参考文献(1)
  • 二级参考文献(4)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(7)
  • 参考文献(0)
  • 二级参考文献(7)
2013(6)
  • 参考文献(1)
  • 二级参考文献(5)
2014(8)
  • 参考文献(0)
  • 二级参考文献(8)
2015(7)
  • 参考文献(1)
  • 二级参考文献(6)
2016(5)
  • 参考文献(0)
  • 二级参考文献(5)
2017(7)
  • 参考文献(2)
  • 二级参考文献(5)
2018(8)
  • 参考文献(3)
  • 二级参考文献(5)
2019(5)
  • 参考文献(5)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
缺陷预测
类别不平衡
过采样
集成学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导