作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在数据分类分析中,一些特别的类别里往往存在更重要的信息.提出一种基于集成学习,欠采样和代价敏感的类别不平衡数据分类算法(USCensemble),来解决传统算法处理类别不平衡数据分类任务时难以正确识别少数类样本的问题.该算法首先运用EasyEnsemble的算法结构,在前一组数据训练完毕后,运用欠采样方法选取权重大的多数类样本,并将其与少数类样本结合为临时训练数据以此平衡数据集并进行下一轮训练.同时赋予少数类样本更大的错分代价,快速提高错误分类的少数类的样本权重,降低多数类的样本权重,使算法更倾向少数类的正确分类,达到对少数类样本正确识别的目的.在10个u c i的数据集生成的分类任务上进行了对比实验,实验结果表明,该算法能更好地识别少数类样本.
推荐文章
不平衡数据的集成分类算法综述
不平衡数据
集成学习
分类
代价敏感
数据采样
不平衡入侵检测数据的代价敏感分类策略
不平衡数据
数据预处理
代价敏感
入侵检测
集成学习算法在不平衡分类中的应用研究
机器学习
类不平衡
集成学习
评测标准
MapReduce环境下处理多类别不平衡数据的改进随机森林算法
MapReduce
随机森林
分层采样
HDDT决策树
选择集成
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于集成学习和代价敏感的类别不平衡数据分类算法
来源期刊 信息记录材料 学科 工学
关键词 类别不平衡数据 分类 集成学习 欠采样 代价敏感
年,卷(期) 2022,(1) 所属期刊栏目 综述与论著
研究方向 页码范围 18-22
页数 5页 分类号 TP274
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
类别不平衡数据
分类
集成学习
欠采样
代价敏感
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息记录材料
月刊
1009-5624
13-1295/TQ
大16开
河北省保定市乐凯南大街6号
18-185
1978
chi
出版文献量(篇)
9919
总下载数(次)
46
总被引数(次)
13955
论文1v1指导