基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对不平衡数据集的低分类准确性,提出基于蚁群聚类改进的SMOTE不平衡数据过采样算法ACC-SMOTE.一方面利用改进的蚁群聚类算法将少数类样本划分为不同的子簇,充分考虑类间与类内数据的不平衡,根据子簇所占样本的比例运用SMOTE算法进行过采样,从而降低类内数据的不平衡度;另一方面对过采样后的少数类样本采用Tomek Links数据清理技术进行及时修正,清除数据集中的噪声和抽样方法产生的重叠样例,从而保证合成样本的质量.本文所用训练数据集和测试数据集均为UCI数据集.实验结果表明本算法可以明显提高不平衡数据集的分类精度,从而提高分类器的分类性能.
推荐文章
不平衡数据集的分类方法研究
机器学习
不平衡数据
数据分类
剪枝与欠采样相结合的不平衡数据分类方法
机器学习
不平衡数据集
剪枝技术
欠采样技术
交叉验证
合并分类器增强算法
基于AdaBoost的类不平衡学习算法
机器学习
类不平衡学习
集成学习
SMOTE
数据清理技术
面向类不平衡数据集的软件缺陷预测模型
软件缺陷预测
类不平衡数据
特征选择
集成算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于蚁群聚类的不平衡数据过采样方法
来源期刊 烟台大学学报(自然科学与工程版) 学科
关键词 不平衡数据集 蚁群聚类 数据清理 过采样
年,卷(期) 2021,(2) 所属期刊栏目 研究论文|Research Papers
研究方向 页码范围 210-216
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.13951/j.cnki.37-1213/n.200502
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (78)
共引文献  (16)
参考文献  (15)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1966(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(7)
  • 参考文献(1)
  • 二级参考文献(6)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(7)
  • 参考文献(0)
  • 二级参考文献(7)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(9)
  • 参考文献(1)
  • 二级参考文献(8)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(6)
  • 参考文献(1)
  • 二级参考文献(5)
2015(4)
  • 参考文献(1)
  • 二级参考文献(3)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(8)
  • 参考文献(1)
  • 二级参考文献(7)
2018(7)
  • 参考文献(0)
  • 二级参考文献(7)
2019(7)
  • 参考文献(7)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
不平衡数据集
蚁群聚类
数据清理
过采样
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
烟台大学学报(自然科学与工程版)
季刊
1004-8820
37-1213/N
16开
山东省烟台市莱山区
1988
chi
出版文献量(篇)
1409
总下载数(次)
0
总被引数(次)
5478
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导