基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对欠抽样可能导致有用信息的丢失,以及合成小类的过抽样技术(SMOTE)可能使大类和小类间类重叠更严重的问题,文中提出基于安全样本筛选的欠抽样和SMOTE结合的抽样方法(Screening SMOTE).利用安全筛选规则,识别并丢弃大类中部分对确定决策边界无价值的实例和噪音实例,采用SMOTE对筛选后数据集进行过抽样.基于安全样本筛选的欠抽样既避免原始数据中有价值信息的丢失,又丢弃大类中的噪音实例,缓减过抽样数据集类重叠的问题.实验表明在处理不平衡数据集,特别是维数较高的不平衡数据集时Screening SMOTE的有效性.
推荐文章
基于样本投影分布的平衡不平衡数据集分类
平衡不平衡数据集
样本投影分布
支持向量机
支持向量数据描述
不平衡数据集的分类方法研究
机器学习
不平衡数据
数据分类
不平衡样本集分类算法研究
支持向量机
分类
欠采样算法
不平衡样本
基于不平衡数据集的客户流失预测研究
类不平衡性
客户流失预测
机器学习
抽样法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于安全样本筛选的不平衡数据抽样方法
来源期刊 模式识别与人工智能 学科 工学
关键词 不平衡数据,安全样本筛选,欠抽样,不平衡比率,合成小类的过抽样技术( SMOTE)
年,卷(期) 2019,(6) 所属期刊栏目 研究与应用
研究方向 页码范围 545-556
页数 12页 分类号 TP391
字数 10321字 语种 中文
DOI 10.16451/j.cnki.issn1003-6059.201906007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 石洪波 山西财经大学信息学院 45 446 11.0 19.0
2 冀素琴 山西财经大学信息学院 13 118 6.0 10.0
3 刘焱昕 山西财经大学信息学院 3 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (29)
参考文献  (16)
节点文献
引证文献  (1)
同被引文献  (4)
二级引证文献  (0)
1978(1)
  • 参考文献(1)
  • 二级参考文献(0)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(4)
  • 参考文献(2)
  • 二级参考文献(2)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(6)
  • 参考文献(1)
  • 二级参考文献(5)
2013(4)
  • 参考文献(2)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
不平衡数据,安全样本筛选,欠抽样,不平衡比率,合成小类的过抽样技术(
SMOTE)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
模式识别与人工智能
月刊
1003-6059
34-1089/TP
16开
中国科学院合肥智能机械研究所安徽合肥董铺岛合肥1130信箱
26-69
1989
chi
出版文献量(篇)
2928
总下载数(次)
8
总被引数(次)
30919
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导