原文服务方: 计算机应用研究       
摘要:
针对传统分类器在数据不均衡的情况下分类效果不理想的缺陷,为提高分类器在不均衡数据集下的分类性能,特别是少数类样本的分类能力,提出了一种基于BSMOTE 和逆转欠抽样的不均衡数据分类算法。该算法使用BSMOTE进行过抽样,人工增加少数类样本的数量,然后通过优先去除样本中的冗余和噪声样本,使用逆转欠抽样方法逆转少数类样本和多数类样本的比例。通过多次进行上述抽样形成多个训练集合,使用Bagging方法集成在多个训练集合上获得的分类器来提高有效信息的利用率。实验表明,该算法较几种现有算法不仅能够提高少数类样本的分类性能,而且能够有效提高整体分类准确度。
推荐文章
基于分解策略处理多分类不均衡问题的方法
多分类问题
不均衡数据集
分解策略
人工样本
集成学习
动态加权
不均衡数据在股票研报分类中的应用
不均衡数据
股票研报
CHI统计
SVM算法
层次欠采样
不均衡数据集中基于Adaboost的过抽样算法
不均衡数据集
过抽样
提升算法
基于支持向量机的不均衡文本分类方法
混合算法
支持向量机
不均衡数据集
插值样本
文本分类
迭代进化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于BSMOTE和逆转欠抽样的不均衡数据分类算法
来源期刊 计算机应用研究 学科
关键词 不均衡数据集 边界少数类样本合成过抽样技术 逆转欠抽样技术 多分类器集成
年,卷(期) 2014,(11) 所属期刊栏目
研究方向 页码范围 3299-3303
页数 5页 分类号 TP301.6|TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2014.11.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡荣贵 解放军电子工程学院网络系 9 75 4.0 8.0
2 张亮 解放军电子工程学院网络系 13 120 5.0 10.0
3 杨静 解放军电子工程学院网络系 4 24 3.0 4.0
4 陈睿 解放军电子工程学院网络系 3 11 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (16)
共引文献  (20)
参考文献  (9)
节点文献
引证文献  (6)
同被引文献  (24)
二级引证文献  (10)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(5)
  • 参考文献(2)
  • 二级参考文献(3)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(4)
  • 参考文献(4)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(4)
  • 引证文献(3)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
2020(5)
  • 引证文献(0)
  • 二级引证文献(5)
研究主题发展历程
节点文献
不均衡数据集
边界少数类样本合成过抽样技术
逆转欠抽样技术
多分类器集成
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导