基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
不平衡数据在信用评估、财务造假、医疗诊断等现实应用中广泛存在.在众多处理不平衡数据的算法中,SMOTE算法(synthetic minority over-sampling technique)应用最为广泛.为解决SMOTE算法在生成数据时会弱化数据的真实分布,同时考虑到本福特法则(Benford's Law)在处理自然数据中可以弥补数据弱化这一特点,将SMOTE算法与Benford's Law相结合,提出一种新的处理类别不平衡数据的算法(BL-SMOTE算法),以提高数据分布真实性和准确性.实验结果表明,BL-SMOTE算法分类效果优于SMOTE算法.同时,相比于逻辑回归、决策树、梯度提升树等,随机森林的效果更优.
推荐文章
基于KM-SMOTE和随机森林的不平衡数据分类
K-means
SMOTE算法
随机森林
不平衡数据集
面向不平衡分类的IDP-SMOTE重采样算法
不平衡数据
分类
重采样
密度峰值聚类
一种处理不平衡大数据的并行随机森林算法
不平衡大数据
MapReduce
随机森林
代价敏感
分层自助抽样
基于支持向量机的不平衡数据分类算法的研究
Smote
黎曼几何
核函数
支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于BL-SMOTE和随机森林的不平衡数据分类
来源期刊 北京信息科技大学学报(自然科学版) 学科 工学
关键词 本福德法则 SMOTE算法 随机森林 不平衡数据
年,卷(期) 2019,(2) 所属期刊栏目
研究方向 页码范围 23-28
页数 6页 分类号 TP3
字数 4890字 语种 中文
DOI 10.16508/j.cnki.11-5866/n.2019.02.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李国成 北京信息科技大学理学院 17 4 1.0 2.0
2 张宸宁 北京信息科技大学理学院 4 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1976(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
本福德法则
SMOTE算法
随机森林
不平衡数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京信息科技大学学报(自然科学版)
双月刊
1674-6864
11-5866/N
大16开
北京市
1986
chi
出版文献量(篇)
2043
总下载数(次)
10
总被引数(次)
11074
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导