作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种基于信息熵的可伸缩决策树生成算法SDTA(A Scalable Decision Tree Algorithm).与SPRINT算法不同,该算法使用基于信息熵增益的思想分割训练样本集,引入了新的数据结构:基于类别的属性表.该表记录存储了计算分割属性的所有信息,并且该表的大小不会随样本集的增大而增大,可以常贮主存.与SLIQ算法相比,SDTA算法彻底摆脱了主存容量对算法效率的限制.实验表明,SDTA算法能生成正确的决策树,而且具有良好的可伸缩性.
推荐文章
基于信息熵的决策树UE提升研究
决策树
预测
用户体验
属性频率划分和信息熵离散化的决策树算法
决策树
粗糙集
属性频率
信息熵
离散化
基于交互信息的连续值属性决策树学习算法
经验概念学习
决策树
最小信息熵
交互信息
离散化
基于度量的决策树
马氏距离
特征子集
决策树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于信息熵的可伸缩决策树算法
来源期刊 中国科技信息 学科 物理学
关键词 分类 决策树 可伸缩
年,卷(期) 2005,(24) 所属期刊栏目 科技论坛
研究方向 页码范围 15
页数 1页 分类号 O4
字数 2002字 语种 中文
DOI 10.3969/j.issn.1001-8972.2005.24.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 耿焱 南京审计学院信息科学学院 9 22 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2008(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分类
决策树
可伸缩
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科技信息
半月刊
1001-8972
11-2739/N
大16开
北京西城区车公庄大街16号1号楼1610室
82-415
1989
chi
出版文献量(篇)
49952
总下载数(次)
82
总被引数(次)
131979
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导