基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决不均衡多分类问题,提出了一种基于采样和特征选择的不均衡数据集成分类算法(IDESF).基分类器的多样性会影响集成算法的分类性能,所以IDESF算法对数据集进行有放回采样+SMOTE的两阶段采样.两阶段采样在保证所得数据集中样本合理性的基础上,增加数据集间的差异性以此隐式地提高基分类器的多样性.两阶段采样同样可以平衡数据分布,防止分类器偏向多数类.在两阶段采样的基础上,IDESF算法引入了数据清洗和特征选择方法,试图进一步提高算法的分类性能.与其他不均衡分类算法在5组不均衡数据集上进行了对比实验,结果表明该算法可以获得较高的AUCarea和G-Mean值,具有较为优异的分类效果.
推荐文章
基于分解策略处理多分类不均衡问题的方法
多分类问题
不均衡数据集
分解策略
人工样本
集成学习
动态加权
基于BSMOTE和逆转欠抽样的不均衡数据分类算法
不均衡数据集
边界少数类样本合成过抽样技术
逆转欠抽样技术
多分类器集成
融合DECORATE的异构分类器集成算法
分类器集成
异构
Stacking
DECORATE
差异性
快速多分类器集成算法研究
快速多分类器集成
差分演化
AdaBoost算法
人脸识别
训练时间
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向不均衡数据的多分类集成算法
来源期刊 计算机工程与应用 学科 工学
关键词 不均衡数据集 过采样 数据清洗 特征选择 集成算法 多分类
年,卷(期) 2022,(2) 所属期刊栏目 模式识别与人工智能|Pattern Recognition and Artificial Intelligence
研究方向 页码范围 176-183
页数 8页 分类号 TP301.6
字数 语种 中文
DOI 10.3778/j.issn.1002-8331.2008-0058
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
不均衡数据集
过采样
数据清洗
特征选择
集成算法
多分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
论文1v1指导