基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
如何提高对少数类样本的识别能力是不平衡数据分类中的一个研究热点.合成少数类过采样技术(SMOTE)是解决此类问题的代表性方法之一.近年来,不少研究者对SMOTE做出了一些改进,较好地提高了该方法的性能.然而,如何有效地选取典型少数类样本进行过采样仍然是一个值得研究的问题.此外,被孤立的少数样本在提高模型性能方面的潜在能力也没有得到足够的重视.针对上述问题,提出了基于构造性覆盖算法(CCA)的过采样技术CMOTE.CMOTE提供了两种不同策略下选择关键样本的方法:基于覆盖内样本个数的方法与基于覆盖密度的方法.在12个典型的不平衡数据集上验证CMOTE算法的性能.实验结果表明,CMOTE算法在总体上优于对比方法,并且通过强化关键样本对模型性能的影响增强了模型的泛化能力.
推荐文章
基于情感极性与SMOTE过采样的虚假评论识别方法
虚假评论
情感极性
用户行为
逻辑回归
随机森林
基于商空间的构造性数据挖掘方法的应用研究
商空间
聚类分析
覆盖算法
时间序列
构造性覆盖方法的增量学习算法
构造性机器学习方法
覆盖算法
佳点集
增量学习
面向不平衡分类的IDP-SMOTE重采样算法
不平衡数据
分类
重采样
密度峰值聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 构造性覆盖算法的SMOTE过采样方法
来源期刊 计算机科学与探索 学科 工学
关键词 不平衡数据 过采样技术 合成少数类过采样技术(SMOTE) 构造性覆盖算法(CCA)
年,卷(期) 2020,(6) 所属期刊栏目 人工智能
研究方向 页码范围 975-984
页数 10页 分类号 TP18
字数 6574字 语种 中文
DOI 10.3778/j.issn.1673-9418.1905091
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张燕平 安徽大学计算机科学与技术学院 148 1556 21.0 32.0
2 张以文 安徽大学计算机科学与技术学院 45 260 9.0 14.0
3 严远亭 安徽大学计算机科学与技术学院 8 28 3.0 5.0
4 朱原玮 安徽大学计算机科学与技术学院 1 0 0.0 0.0
5 吴增宝 安徽大学计算机科学与技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (26)
参考文献  (18)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(4)
  • 参考文献(2)
  • 二级参考文献(2)
2010(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
不平衡数据
过采样技术
合成少数类过采样技术(SMOTE)
构造性覆盖算法(CCA)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导