基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
软件缺陷预测数据集在搜集过程中存在标注成本较高的问题,引入主动学习有利于选择有价值的数据样例来快速构建数据集,但是主动学习一般选出不确定度最高的样例进行人工标注,并未考虑低不确定度样例.为了进一步降低数据标注的成本,融合信息熵与相对熵提出一种基于代价敏感的混合式主动学习策略.该策略首先使用基于信息熵的主动学习策略,将信息熵最高的样例交由领域专家进行人工标注;对于信息熵最低的样例,借助查询委员会进行二次分析,若满足阈值则进行伪标注.实证研究表明,在同等标注样例的情形下,该策略的AUC值要优于其他3种经典的主动学习策略.使用基于代价敏感的主动学习查询策略可以有效提高软件缺陷预测领域的标注效率并降低标注成本.
推荐文章
基于代价敏感学习的软件缺陷预测方法
软件缺陷预测
代价敏感
拉普拉斯特征映射
神经网络
基于代价敏感神经网络算法的软件缺陷预测
软件缺陷预测
代价敏感神经网络
代价敏感
类不均衡
代价敏感分类的软件缺陷预测方法
软件缺陷预测
代价敏感分类
最优代价因子
决策树
集成算法
基于代价敏感支持向量机的软件缺陷预测研究
软件缺陷预测
代价敏感
支持向量机
非平衡数据分类
参数选择
遗传算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于代价敏感主动学习的软件缺陷预测方法
来源期刊 南通大学学报(自然科学版) 学科 工学
关键词 代价敏感 主动学习 软件缺陷预测 信息熵 Kullback-Leibler离散度
年,卷(期) 2019,(1) 所属期刊栏目 智能科学与技术
研究方向 页码范围 9-15
页数 7页 分类号 TP311.5
字数 4442字 语种 中文
DOI 10.3969/j.issn.1673-2340.2019.01.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈翔 南通大学信息科学技术学院 64 475 12.0 19.0
2 曲豫宾 江苏工程职业技术学院信息工程学院 7 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (105)
共引文献  (55)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(9)
  • 参考文献(0)
  • 二级参考文献(9)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(17)
  • 参考文献(2)
  • 二级参考文献(15)
2013(18)
  • 参考文献(0)
  • 二级参考文献(18)
2014(6)
  • 参考文献(0)
  • 二级参考文献(6)
2015(16)
  • 参考文献(1)
  • 二级参考文献(15)
2016(10)
  • 参考文献(2)
  • 二级参考文献(8)
2017(3)
  • 参考文献(1)
  • 二级参考文献(2)
2018(2)
  • 参考文献(1)
  • 二级参考文献(1)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
代价敏感
主动学习
软件缺陷预测
信息熵
Kullback-Leibler离散度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南通大学学报(自然科学版)
季刊
1673-2340
32-1755/N
大16开
江苏省南通市啬园路9号
2002
chi
出版文献量(篇)
1549
总下载数(次)
7
总被引数(次)
6139
论文1v1指导