基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
数据挖掘是当今社会最活跃的研究方向之一,迄今为止数据挖掘技术已经广泛应用到各行各业中,然而在数据挖掘过程中往往会遇到很多非平衡训练集,采用传统的数据挖掘技术对非平衡训练集集进行处理不能得到理想的效果.主要是针对非平衡训练集,对数据进行NCL(Neighborhood Cleaning Rule)技术处理并结合随机森林(Random Forest)算法进行分类,试验结果表明,改进后的随机森林算法分类效果更好.
推荐文章
一种处理非平衡数据集的优化随机森林分类方法
随机森林
最大投票熵
广义欧几里得距离
不平衡数据集
一种面向非均衡分类的随机森林算法
非均衡分类
K-L距离
随机森林
平衡随机森林
Bagging
基于非平衡数据的随机森林分类算法改进
非平衡数据
随机森林算法
有条件的Bootstrap重抽样
加权的决策树
一种非平衡数据分类的过采样随机森林算法
非平衡数据集
少数类
合成样本
分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向非平衡训练集分类的随机森林算法优化
来源期刊 工业控制计算机 学科
关键词 数据挖掘 非平衡训练集 随机森林 NCL
年,卷(期) 2013,(7) 所属期刊栏目 软件与仿真
研究方向 页码范围 89-90
页数 2页 分类号
字数 2615字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴琼 上海大学机电工程与自动化学院 20 123 6.0 11.0
2 李运田 上海大学机电工程与自动化学院 6 51 3.0 6.0
3 郑献卫 上海大学机电工程与自动化学院 5 58 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (42)
参考文献  (6)
节点文献
引证文献  (35)
同被引文献  (32)
二级引证文献  (27)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(8)
  • 引证文献(8)
  • 二级引证文献(0)
2017(8)
  • 引证文献(8)
  • 二级引证文献(0)
2018(11)
  • 引证文献(4)
  • 二级引证文献(7)
2019(16)
  • 引证文献(9)
  • 二级引证文献(7)
2020(17)
  • 引证文献(4)
  • 二级引证文献(13)
研究主题发展历程
节点文献
数据挖掘
非平衡训练集
随机森林
NCL
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
工业控制计算机
月刊
1001-182X
32-1764/TP
大16开
南京市龙蟠路173号江苏省计算技术研究所
28-60
1988
chi
出版文献量(篇)
13243
总下载数(次)
60
论文1v1指导