基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
非均衡数据是分类中的常见问题,当一类实例远远多于另一类实例,则代表类非均衡,真实世界的分类问题存在很多类别非均衡的情况并得到众多专家学者的重视,非均衡数据的分类问题已成为数据挖掘和模式识别领域中新的研究热点,是对传统分类算法的重大挑战.本文提出了一种新型重取样算法,采用改进的SMOTE算法对少数类数据进行过取样,产生新的少数类样本,使类之间数据量基本均衡,然后再根据SMO算法的特点,提出使用聚类的数据欠取样方法,删除冗余或噪音数据.通过对数据集的过取样和清理之后,一些有用的样本被保留下来,减少了数据集规模,增强支持向量机训练执行的效率.实验结果表明,该方法在保持整体分类性能的情况下可以有效地提高少数类的分类精度.
推荐文章
基于混合采样的非平衡数据集分类研究
混合采样
错分样本
非平衡数据集
AdaBoost算法
支持向量机算法
基于改进的SMOTE和RST的新型混合重取样算法
分类
非均衡数据集
混合重取样
SMOTE
粗糙集理论
一种处理非平衡数据集的优化随机森林分类方法
随机森林
最大投票熵
广义欧几里得距离
不平衡数据集
一种基于能耗均衡的非均匀分簇路由算法
链状拓扑
WSNs
分簇路由
能耗均衡
网络生命周期
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于混合重取样策略的非均衡数据集分类算法
来源期刊 计算机工程与科学 学科 工学
关键词 分类 非均衡数据集 预处理 混合重取样 SMOTE 聚类
年,卷(期) 2012,(10) 所属期刊栏目 信息系统
研究方向 页码范围 128-134
页数 分类号 TP301.6
字数 5679字 语种 中文
DOI 10.3969/j.issn.1007-130X.2012.10.026
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 袁磊 湖北文理学院数学与计算机科学学院 33 176 8.0 12.0
2 谷琼 湖北文理学院数学与计算机科学学院 51 250 9.0 13.0
3 华丽 湖北文理学院数学与计算机科学学院 16 81 6.0 9.0
4 宁彬 湖北文理学院数学与计算机科学学院 53 197 9.0 12.0
5 吴钊 湖北文理学院数学与计算机科学学院 22 109 6.0 10.0
6 李文新 湖北文理学院数学与计算机科学学院 2 25 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (25)
同被引文献  (70)
二级引证文献  (50)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(3)
  • 引证文献(3)
  • 二级引证文献(0)
2015(4)
  • 引证文献(1)
  • 二级引证文献(3)
2016(5)
  • 引证文献(0)
  • 二级引证文献(5)
2017(5)
  • 引证文献(2)
  • 二级引证文献(3)
2018(11)
  • 引证文献(5)
  • 二级引证文献(6)
2019(31)
  • 引证文献(11)
  • 二级引证文献(20)
2020(15)
  • 引证文献(2)
  • 二级引证文献(13)
研究主题发展历程
节点文献
分类
非均衡数据集
预处理
混合重取样
SMOTE
聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导