基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前软件缺陷预测的研究主要是从历史数据获取来源和预测方法这两方面入手。然而,获取到的软件历史缺陷数据往往是非均衡的,传统的预测方法会给缺陷数据带来极大的误分率。针对这一问题,提出使用基于统计抽样的非均衡分类方法来预测软件缺陷。通过经验性地对比分析12种已有抽样与分类算法组合的预测性能优劣,得到SpreadSubsampling和随机森林结合的方法( SP-RF)综合表现最好,但具有较高伪正率( FPR)。为了进一步提高预测性能,针对原始SP-RF方法会对原始数据带来较大的噪音及信息缺失等不足,提出一种基于SP-RF的内置均衡化抽样的自适应随机森林改进算法( IBSBA-RF)。实验表明,IBSBA-RF算法可以显著降低预测结果的FPR,并且进一步提高了预测结果的AUC和Balance值。
推荐文章
软件缺陷分类的研究
软件缺陷
缺陷分类
软件故障
软件失效
偏相关方法在软件缺陷预测中的应用
软件缺陷预测
代码静态属性
实证
复杂度
机器学习
偏相关
基于缺陷分类的软件缺陷分析方法
软件缺陷分析
缺陷管理
软件质量
缺陷分类
缺陷密度
基于超欧氏距离近邻传播的软件缺陷预测方法
密度
近邻传播
软件缺陷
超欧氏距离
预测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于统计抽样的非均衡分类方法在软件缺陷预测中的应用
来源期刊 计算机应用与软件 学科 工学
关键词 软件缺陷预测 非均衡 抽样 随机森林 代价敏感
年,卷(期) 2015,(8) 所属期刊栏目 嵌入式软件与应用
研究方向 页码范围 215-219,233
页数 6页 分类号 TP311
字数 5739字 语种 中文
DOI 10.3969/j.issn.1000-386x.2015.08.052
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张文 中国科学院软件研究所基础软件国家工程研究中心 47 635 13.0 24.0
2 王永吉 中国科学院软件研究所基础软件国家工程研究中心 31 403 12.0 19.0
3 徐可欣 中国科学院软件研究所基础软件国家工程研究中心 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (11)
节点文献
引证文献  (2)
同被引文献  (7)
二级引证文献  (2)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
软件缺陷预测
非均衡
抽样
随机森林
代价敏感
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导