基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为提高大规模数据集生成树的准确率,提出一种预生成一棵基于这个数据集的决策树,采用广度优先遍历将其划分为满足预定义的限制的数据集,再对各数据集按照一定比例进行随机采样,最后将采样结果整合为目标数据集的数据采样方法.通过对一UCI数据集进行采样,并用现有决策树算法实验证明,该采样方法优于传统随机采样方法,基于该采样方法的生成树准确率有所提高.
推荐文章
大规模数据集的多层聚类算法
谱聚类
聚类
图像分割
一种并行决策树学习方法研究
决策树
并行学习
故障诊断
分裂属性
一种改进的决策树算法及其应用
铝电解
决策树
加权信息增益
加权ID3
一种改进 ID3型决策树挖掘算法
数据挖掘
ID3型决策树
熵值计算
UCI数据集
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种用于大规模数据集的决策树采样策略
来源期刊 微型机与应用 学科 经济
关键词 决策树 样本选取 广度优先遍历
年,卷(期) 2010,(21) 所属期刊栏目 软件天地
研究方向 页码范围 5-6,13
页数 分类号 FP311
字数 2248字 语种 中文
DOI 10.3969/j.issn.1674-7720.2010.21.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王会进 暨南大学信息科学技术学院 41 303 11.0 15.0
2 赵国强 暨南大学信息科学技术学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
决策树
样本选取
广度优先遍历
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术与网络安全
月刊
2096-5133
10-1543/TP
大16开
北京市海淀区清华东路25号(北京927信箱)
82-417
1982
chi
出版文献量(篇)
10909
总下载数(次)
33
总被引数(次)
35987
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导