原文服务方: 河南科学       
摘要:
少数类样本合成过抽样技术(SMOTE)是一种过抽样数据预处理算法,是在两个少数类之间随机插入一个新的少数类样本.为了解决SMOTE算法生成少数样本随机性的局限性,在考虑多数类样本分布会对少数样本的生成产生影响的基础上,提出了改进的SMOTE算法.在WEKA平台上分别使用改进前后的SMOTE算法对选用的UCI数据集进行过抽样数据预处理,并使用朴素贝叶斯、决策树和K邻近分类器对过抽样后的数据集进行分类,选择几何均数(G-mean)和曲线下面积(AUC)两个评价指标,实验显示改进后的SMOTE算法预处理的数据集的分类效果更好,证明改进后的SMOTE算法生成的少数类样本更加合理.
推荐文章
基于改进的SMOTE和RST的新型混合重取样算法
分类
非均衡数据集
混合重取样
SMOTE
粗糙集理论
一种改进的HRLS算法
HRLS算法
FIR滤波器
信道估计
收敛性
一种改进的Ford算法
网络
最短路
表上作业法
算法
一种改进的模式匹配算法
模式匹配
BM算法
BM改进算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的SMOTE算法
来源期刊 河南科学 学科
关键词 不平衡数据集 少数类样本合成过抽样技术 几何均数 曲线下面积
年,卷(期) 2018,(7) 所属期刊栏目 数学与信息科学
研究方向 页码范围 1009-1013
页数 5页 分类号 TP391.9
字数 语种 中文
DOI 10.3969/j.issn.1004-3918.2018.07.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李红 咸阳师范学院计算机学院 68 203 7.0 10.0
2 刘小豫 咸阳师范学院计算机学院 51 97 5.0 8.0
3 魏浩 咸阳师范学院计算机学院 23 101 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (139)
共引文献  (124)
参考文献  (19)
节点文献
引证文献  (5)
同被引文献  (10)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(11)
  • 参考文献(0)
  • 二级参考文献(11)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(8)
  • 参考文献(0)
  • 二级参考文献(8)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(20)
  • 参考文献(0)
  • 二级参考文献(20)
2010(11)
  • 参考文献(1)
  • 二级参考文献(10)
2011(11)
  • 参考文献(2)
  • 二级参考文献(9)
2012(9)
  • 参考文献(1)
  • 二级参考文献(8)
2013(10)
  • 参考文献(1)
  • 二级参考文献(9)
2014(20)
  • 参考文献(2)
  • 二级参考文献(18)
2015(14)
  • 参考文献(2)
  • 二级参考文献(12)
2016(12)
  • 参考文献(1)
  • 二级参考文献(11)
2017(8)
  • 参考文献(6)
  • 二级参考文献(2)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2018(4)
  • 参考文献(3)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
不平衡数据集
少数类样本合成过抽样技术
几何均数
曲线下面积
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
河南科学
月刊
1004-3918
41-1084/N
大16开
1982-01-01
chi
出版文献量(篇)
7317
总下载数(次)
0
总被引数(次)
26314
论文1v1指导