原文服务方: 计算机应用研究       
摘要:
针对软件故障数据中正例样本相对较少且大量样本标注困难的现实场景,已知未标注样本中包含用于建立故障检测模型的大量有用信息,提出仅用正例和未标注数据构建分类模型对软件开发过程中的故障进行检测的半监督学习方法。首先采用合成少数类过采样 SMOTE 算法对数据集中的正例样本进行过采样,平衡数据集中的类分布。在此基础上合理构建正例集合和未标注集合,采用 POSC 4.5和 Bagging 算法构建软件故障决策树集成分类器。通过对 NASA MDP 数据库中的12个数据集进行对比实验,结果表明,仅用正例和未标注数据建模可以得到与有监督学习方法相近的软件故障检测率,且集成分类器方法比单分类器方法具有更高的检测率,未标注样本集大小的软件故障检测率同样有影响。
推荐文章
基于集成 PU 学习数据流分类的入侵检测方法
入侵检测
集成分类
数据流
学习
基于JAVA的软件故障自动检测系统设计
JAVA
软件故障
自动检测
特征提取
数据融合滤波技术
故障特征挖掘
基于深度学习的变压器在线故障检测
深度学习
故障检测
密度图像
曲线拟合
基于SVM主动学习技术的 PU 文本分类
支持向量机
主动学习
PU
文本分类
Rocchio
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于 PU 学习的软件故障检测研究
来源期刊 计算机应用研究 学科
关键词 软件故障检测 正例和未标注学习 不平衡数据 决策树 集成分类器
年,卷(期) 2015,(11) 所属期刊栏目 软件技术研究
研究方向 页码范围 3324-3327,3331
页数 5页 分类号 TP311.5
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2015.11.028
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张阳 西北农林科技大学信息工程学院 47 232 6.0 13.0
2 李梅 西北农林科技大学机电学院 25 93 6.0 9.0
3 蔡晓妍 西北农林科技大学信息工程学院 7 15 2.0 3.0
4 张荷 西北农林科技大学信息工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (54)
参考文献  (18)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (0)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(5)
  • 参考文献(2)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(6)
  • 参考文献(1)
  • 二级参考文献(5)
2007(10)
  • 参考文献(2)
  • 二级参考文献(8)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(9)
  • 参考文献(4)
  • 二级参考文献(5)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
软件故障检测
正例和未标注学习
不平衡数据
决策树
集成分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导