基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于集成学习的自训练算法是一种半监督算法,不少学者通过集成分类器类别投票或平均置信度的方法选择可靠样本。基于置信度的投票策略倾向选择置信度高的样本或置信度低但投票却一致的样本进行标记,后者这种情形可能会误标记靠近决策边界的样本,而采用异构集成分类器也可能会导致各基分类器对高置信度样本的类别标记不同,从而无法将其有效加入到有标记样本集。提出了结合主动学习与置信度投票策略的集成自训练算法用来解决上述问题。该算法合理调整了投票策略,选择置信度高且投票一致的无标记样本加以标注,同时利用主动学习对投票不一致而置信度较低的样本进行人工标注,以弥补集成自训练学习只关注置信度高的样本,而忽略了置信度低的样本的有用信息的缺陷。在UCI数据集上的对比实验验证了该算法的有效性。
推荐文章
基于委员会投票选择方法的主动学习的研究
主动学习
委员会投票选择
投票熵
最大熵
高中生英语学习能力训练方法
高中英语
学习能力
训练方法
基于联邦学习的短期负荷预测模型协同训练方法
数据隐私
机器学习
负荷预测
联邦学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 结合主动学习与置信度投票的集成自训练方法
来源期刊 计算机工程与应用 学科 工学
关键词 集成自训练算法 主动学习 加权K最近邻(KNN) 朴素贝叶斯 置信度
年,卷(期) 2016,(20) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 167-171,230
页数 6页 分类号 TP181
字数 4833字 语种 中文
DOI 10.3778/j.issn.1002-8331.1605-0175
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吕佳 重庆师范大学计算机与信息科学学院 56 473 9.0 20.0
2 黎隽男 重庆师范大学计算机与信息科学学院 3 15 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (30)
参考文献  (9)
节点文献
引证文献  (7)
同被引文献  (18)
二级引证文献  (13)
1967(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(9)
  • 引证文献(4)
  • 二级引证文献(5)
2019(8)
  • 引证文献(1)
  • 二级引证文献(7)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
集成自训练算法
主动学习
加权K最近邻(KNN)
朴素贝叶斯
置信度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导