基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
样本标签的完整性对于有监督学习问题的分类精度有着显著影响,然而在现实数据中,由于标注过程的随机性和标注人员的不专业性等因素,数据标签不可避免地会受到噪声污染,即样本的观测标签不同于真实标签.为降低噪声标签对分类器分类精度的负面影响,文中提出一种噪声标签纠正方法,该方法利用基分类器对观测样本进行分类并估计噪声率,以识别噪声标签数据,再利用基分类器的分类结果对噪声标签样本进行重新标注,得到噪声标签样本被修正后的样本数据集.在合成数据集与真实数据集上的实验结果表明,该重标注算法在不同基分类器和不同噪声率干扰下对分类结果都有一定的提升作用,在合成数据集上对比无降噪声算法,其正确率提升5%左右,而在CIFAR和MNIST数据集上的高噪声率环境下,该重标注算法的F1值比Elk08和Nat13平均高7%以上,比无噪声算法高53%.
推荐文章
基于双视角投影空间表示的文本多标签标注方法
投影空间
文本标注
多标签
双视角
农作物种子包装的标签标注问题
农作物
种子
标签
标注
对当前玉米种子标签标注问题的思考
玉米种子
标签标注
农作物
管理模式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 噪声标签重标注方法
来源期刊 计算机科学 学科 工学
关键词 噪声标签学习 重标注标签 逻辑回归 朴素贝叶斯
年,卷(期) 2020,(6) 所属期刊栏目 数据库&大数据&数据科学
研究方向 页码范围 79-84
页数 6页 分类号 TP301
字数 6170字 语种 中文
DOI 10.11896/jsjkx.190600041
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐建 南京理工大学计算机科学与工程学院 62 241 8.0 12.0
2 余孟池 南京理工大学计算机科学与工程学院 2 0 0.0 0.0
3 牟甲鹏 南京理工大学计算机科学与工程学院 2 0 0.0 0.0
4 蔡剑 南京理工大学计算机科学与工程学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (73)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
噪声标签学习
重标注标签
逻辑回归
朴素贝叶斯
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导