基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
主动学习算法可以有效减少样本标注的工作量,每次选取最有信息量的样本交由专家标注.样本的代表性与不确定性都是衡量样本信息量的重要因素,将两者综合考虑能够获得更好的综合效果,但在两者的结合方式上一直存在不少问题,导致算法的适应性不强.为解决该问题,本文提出了基于样本不同属性的鲁棒偏倚赖主动学习分类算法,通过引入偏倚赖权值系数函数,在综合考虑样本的代表性和不确定性的同时,更可以突出样本的特性.同时由于样本代表性模型的渐变,在选择样本过程中更能突出代表性样本与不确定性样本的学习层次,前期训练以代表性样本为主,后期训练以不确定性样本为主,使得算法的适应性大大提高.在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,与所提供的对比算法相比,本文的方法只需较少的标注样本便可以达到相同的分类正确率.
推荐文章
基于角度优化的鲁棒极端学习机算法
极端学习机
鲁棒激活函数
角度优化
结合主动学习策略的半监督分类算法
半监督分类
主动学习
投票熵
样本密度
基于主动学习的分类器融合算法
主动学习
分类器
融合算法
基于主动学习的微博数据分类
微博数据
主动学习
支持向量机
分类模型
训练集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于样本不同属性综合的鲁棒偏倚赖主动学习分类算法研究
来源期刊 燕山大学学报 学科 工学
关键词 主动学习 偏倚赖 样本代表性 样本不确定性 分类
年,卷(期) 2011,(1) 所属期刊栏目
研究方向 页码范围 74-80
页数 分类号 TP181
字数 6462字 语种 中文
DOI 10.3969/j.issn.1007-791X.2011.01.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡正平 燕山大学信息科学与工程学院 160 1215 17.0 28.0
2 任大伟 燕山大学信息科学与工程学院 10 27 3.0 4.0
3 高文涛 燕山大学信息科学与工程学院 4 16 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (20)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1997(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(7)
  • 参考文献(1)
  • 二级参考文献(6)
2009(6)
  • 参考文献(2)
  • 二级参考文献(4)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
主动学习
偏倚赖
样本代表性
样本不确定性
分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
燕山大学学报
双月刊
1007-791X
13-1219/N
大16开
河北省秦皇岛市河北大街西段438号
18-73
1963
chi
出版文献量(篇)
2254
总下载数(次)
2
论文1v1指导