基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来非平衡多分类数据的学习问题在机器学习和数据挖掘领域备受关注,上采样技术成为解决数据不平衡问题的主要方法,然而已有的上采样技术仍有很多的不足,例如新合成的少数类样本仍可能分布在对应少数类样本的原始区域内,不能有效改善数据分布的不平衡情况.此外,若原始样本中不同类别样本分布存在重叠,则新合成的样本会更容易偏离到其他类样本分布中,从而造成过泛化现象,影响少数类样本的分类精度.为解决上述问题,提出一种二次合成的上采样方法(QuadraticSynthetic MinorityOver-samplingTechnique,QSMOTE).首先通过少数类样本的支持度选择包含重要信息的样本来进行第一次合成,然后通过分析指定少数类样本质心的邻域内样本分布情况来调整第二次样本合成范围,并最终进行第二次合成.在UCI和 MNIST数据集上的实验结果表明,QSMOTE不仅可以改善数据分布的不平衡问题,而且可以尽可能地减少过泛化现象,特别是对少数类样本的分类准确率有大幅提升.
推荐文章
求非凸二次约束二次规划全局解的凸规划方法
非凸
二次约束二次规划
全局解
分支定界
区域删减策略
带有二次约束的一般二次规划问题的松弛分枝定界方法
整体优化
分枝定界方法
拉格朗日对偶
投影次梯度方法
求解二次规划逆问题的非单调信赖域算法
二次规划
逆问题
信赖域算法
非单调策略
牛顿算法
无约束优化
基于电子病历二次开发的非计划二次手术实时监控
非计划二次手术
电子病历
实时监控
医疗质量
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向非平衡多分类问题的二次合成QSMOTE方法
来源期刊 南京大学学报(自然科学版) 学科 工学
关键词 多类非平衡问题 过泛化 重 叠 合成少数类上采样技术(SMOTE)
年,卷(期) 2019,(1) 所属期刊栏目
研究方向 页码范围 1-13
页数 13页 分类号 TP18
字数 8038字 语种 中文
DOI 10.13232/j.cnkij.nju.2019.01.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王文剑 97 798 14.0 23.0
2 郭虎升 山西大学计算机与信息技术学院 24 174 8.0 12.0
3 韩明鸣 山西大学计算机与信息技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(5)
  • 参考文献(5)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
多类非平衡问题
过泛化
重 叠
合成少数类上采样技术(SMOTE)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京大学学报(自然科学版)
双月刊
0469-5097
32-1169/N
江苏省南京市南京大学
chi
出版文献量(篇)
2526
总下载数(次)
6
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导