基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
PU学习是指从正例样本和无标记样本中训练分类器的一种学习方法.针对传统PU学习中所含初始正例过少,难以有效地从无标记样本中选出可靠负例,且分类过程易受噪声点影响等问题.本文提出了一种基于数据模糊性来提取无标记样本中有效信息的PU学习方法:先对正例无标记样本集进行半监督聚类,选出靠近正例样本的低模糊度数据来扩充初始正例集,并选择远离正例样本的低模糊度数据作为可靠负例;再剪辑掉无标记样本中高模糊度数据;最后在扩充后的正例样本集和可靠负例集上训练分类器,对初始无标记样本集进行分类.在标准数据集上的对比实验证实了提出算法的有效性.
推荐文章
基于集成 PU 学习数据流分类的入侵检测方法
入侵检测
集成分类
数据流
学习
基于SVM主动学习技术的 PU 文本分类
支持向量机
主动学习
PU
文本分类
Rocchio
基于 PU 学习的软件故障检测研究
软件故障检测
正例和未标注学习
不平衡数据
决策树
集成分类器
基于模糊数据库的数据查询研究
模糊数据库
数据查询
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于数据模糊性的PU学习研究
来源期刊 北京师范大学学报(自然科学版) 学科 工学
关键词 PU学习 模糊性 可靠负例 噪声点 分类边界
年,卷(期) 2020,(1) 所属期刊栏目
研究方向 页码范围 45-51
页数 7页 分类号 TP181
字数 语种 中文
DOI 10.16360/j.cnki.jbnuns.2020.01.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吕佳 重庆师范大学计算机与信息科学学院重庆市数字农业服务工程技术研究中心 56 473 9.0 20.0
2 李婷婷 重庆师范大学计算机与信息科学学院重庆市数字农业服务工程技术研究中心 5 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(6)
  • 参考文献(1)
  • 二级参考文献(5)
2016(4)
  • 参考文献(2)
  • 二级参考文献(2)
2017(3)
  • 参考文献(2)
  • 二级参考文献(1)
2018(2)
  • 参考文献(1)
  • 二级参考文献(1)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
PU学习
模糊性
可靠负例
噪声点
分类边界
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京师范大学学报(自然科学版)
双月刊
0476-0301
11-1991/N
大16开
北京新外大街19号
82-406
1956
chi
出版文献量(篇)
3342
总下载数(次)
10
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导