基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为进一步弱化数据不均衡对分类算法的束缚,从数据集区域分布特性着手,提出了不均衡数据集上基于子域学习的复合分类模型.子域划分阶段,扩展支持向量数据描述(SVDD)算法给出类的最小界定域,划分出域内密集区与域外稀疏区.借鉴不同类存在相似样本的类重叠概念,对边界样本进行搜索,组合构成重叠域.子域清理阶段,基于邻近算法(KNN)的邻近性假设,结合不同域的密疏程度,设置样本有效性参数,对域内样本逐个检测以清理噪声.各子域隔离参与分类建模,按序组合产生出用于不均衡数据集的复合分类器CCRD.在相似算法对比以及代价敏感MetaCost对比中,CCRD对正类的正确分类改善明显,且未加重负类误判;在SMOTE抽样比较中,CCRD改善了负类的误判情形,且未影响正类的正确分类;在五类数据集的逐个比较中,CCRD分类性能均有提升,在Haberman_stur的正类分类性能提升上尤为明显.结果表明,基于子域学习的复合分类模型的分类性能较好,是一种研究不均衡数据集的较有效的方法.
推荐文章
样本不均衡条件下设备健康度评估方法
支持向量数据描述
二项式回归
健康度
动态权重
不均衡数据集文本分类中少数类样本生成方法研究
不均衡数据集
分类
聚类
遗传算法
样本生成
价值样本选取的不均衡分类
类的不均衡学习
分类
压缩激励网络
代价敏感度学习
基于支持向量机的不均衡文本分类方法
混合算法
支持向量机
不均衡数据集
插值样本
文本分类
迭代进化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多子域隔离学习组合决策用于不均衡样本
来源期刊 计算机应用 学科 工学
关键词 不均衡数据集区域分布 支持向量数据描述 稀疏域与重叠域 子域隔离学习 复合分类器
年,卷(期) 2016,(9) 所属期刊栏目 大数据
研究方向 页码范围 2475-2480
页数 6页 分类号 TP391
字数 5713字 语种 中文
DOI 10.11772/j.issn.1001-9081.2016.09.2475
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 彭新光 太原理工大学计算机科学与技术学院 103 451 10.0 16.0
2 靳燕 山西大学商务学院信息学院 18 32 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (61)
共引文献  (64)
参考文献  (16)
节点文献
引证文献  (2)
同被引文献  (14)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(6)
  • 参考文献(0)
  • 二级参考文献(6)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(12)
  • 参考文献(0)
  • 二级参考文献(12)
2010(7)
  • 参考文献(0)
  • 二级参考文献(7)
2011(3)
  • 参考文献(0)
  • 二级参考文献(3)
2012(13)
  • 参考文献(5)
  • 二级参考文献(8)
2013(5)
  • 参考文献(4)
  • 二级参考文献(1)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
不均衡数据集区域分布
支持向量数据描述
稀疏域与重叠域
子域隔离学习
复合分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导