基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在监督学习中,标签噪声对模型建立有较大的影响.目前对于标签噪声的处理方法主要有基于模型预测的过滤方法和鲁棒性建模方法,然而这些方法存在过滤效果差或者过滤效率低等问题.针对该问题,该文提出一种基于数据分布的标签噪声过滤方法.首先对于数据集中的每一个样本,根据其近邻内样本的分布,将其及邻域样本形成的区域划分为高密度区域和低密度区域,然后针对不同的区域采用不同的噪声过滤规则进行过滤.与已有方法相比,该方法从数据分布角度出发,使得噪声过滤更具有针对性从而提高过滤效果;此外,使用过滤规则对噪声数据进行处理而非建立噪声预测模型,因而可以提高过滤效率.在15个UCI标准多分类数据集上的实验结果表明:该方法在噪声低于30%时,噪声检测效率和分类精度均有很好的表现.
推荐文章
基于标签分类的协同过滤推荐算法
协同过滤
矩阵分解
交替最小二乘法
迭代投影寻踪
监督学习
基于标签优化的协同过滤推荐算法
标签
拓展近邻
协同过滤
流数据环境下基于k集合覆盖的分布式标签共现算法
流数据
分布式标签
共现算法
k集合覆盖
基于实测电力噪声分布的窄带电力噪声建模
电力线通信
智能电网
正交频分复用
分隔马氏链
马尔克夫链蒙特卡罗
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于数据分布的标签噪声过滤
来源期刊 清华大学学报(自然科学版) 学科 工学
关键词 标签噪声 噪声过滤 模型鲁棒性 数据分布
年,卷(期) 2019,(4) 所属期刊栏目 计算机科学与技术
研究方向 页码范围 262-269
页数 8页 分类号 TP181
字数 语种 中文
DOI 10.16511/j.cnki.qhdxxb.2018.26.059
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王文剑 97 798 14.0 23.0
2 姜高霞 14 49 3.0 6.0
3 陈庆强 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (17)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1968(1)
  • 参考文献(1)
  • 二级参考文献(0)
1972(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(2)
  • 参考文献(2)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
标签噪声
噪声过滤
模型鲁棒性
数据分布
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
清华大学学报(自然科学版)
月刊
1000-0054
11-2223/N
大16开
北京市海淀区清华园清华大学
2-90
1915
chi
出版文献量(篇)
7846
总下载数(次)
26
总被引数(次)
132043
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导