原文服务方: 计算机应用研究       
摘要:
针对软件故障数据中正例样本相对较少且大量样本标注困难的现实场景,已知未标注样本中包含用于建立故障检测模型的大量有用信息,提出仅用正例和未标注数据构建分类模型对软件开发过程中的故障进行检测的半监督学习方法。首先采用合成少数类过采样 SMOTE 算法对数据集中的正例样本进行过采样,平衡数据集中的类分布。在此基础上合理构建正例集合和未标注集合,采用 POSC 4.5和 Bagging 算法构建软件故障决策树集成分类器。通过对 NASA MDP 数据库中的12个数据集进行对比实验,结果表明,仅用正例和未标注数据建模可以得到与有监督学习方法相近的软件故障检测率,且集成分类器方法比单分类器方法具有更高的检测率,未标注样本集大小的软件故障检测率同样有影响。
推荐文章
基于数据模糊性的PU学习研究
PU学习
模糊性
可靠负例
噪声点
分类边界
基于执行轨迹谱分段检测的软件故障定位方法
软件调试
执行轨迹谱
分段检测
故障定位
基于代码检测的软件故障定位方法
软件故障
故障定位
代码检测
软件密集型系统
基于机器学习的软件缺陷预测研究
软件缺陷预测
机器学习
软件可靠性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于 PU 学习的软件故障检测研究
来源期刊 计算机应用研究 学科
关键词 软件故障检测 正例和未标注学习 不平衡数据 决策树 集成分类器
年,卷(期) 2015,(11) 所属期刊栏目 软件技术研究
研究方向 页码范围 3324-3327,3331
页数 5页 分类号 TP311.5
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2015.11.028
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张阳 西北农林科技大学信息工程学院 47 232 6.0 13.0
2 李梅 西北农林科技大学机电学院 25 93 6.0 9.0
3 蔡晓妍 西北农林科技大学信息工程学院 7 15 2.0 3.0
4 张荷 西北农林科技大学信息工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (54)
参考文献  (18)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (0)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(5)
  • 参考文献(2)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(10)
  • 参考文献(2)
  • 二级参考文献(8)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(9)
  • 参考文献(4)
  • 二级参考文献(5)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
软件故障检测
正例和未标注学习
不平衡数据
决策树
集成分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导