基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
决策树算法是在已知具有不同特征的样本数据出现的概率基础上,构建决策树来进行数据分析的一种算法.在数据分类算法中,决策树算法是一种经典的分类决策算法.首先,将所有的数据特征看作是各个树的节点,遍历所有特征,其中每当遍历到其中某个特征时,对特征进行分割处理,并记录分割点的数据信息,作为划分子节点的纯度依据.其次,比较记录的数据特征以及判定最优特征,寻找最优划分方式,对样本数据集进行分割操作.最后,构建符合规则的决策树.针对传统的决策树C4.5算法计算信息增益率时间过长的问题,提出了一种改进的K-C4.5算法,引用麦克劳林公式和泰勒公式的思想,将信息增益率计算公式从对数函数转化为非对数函数,从而降低运算的时间效率.以实际数据集进行测试,验证了改进后的算法具有一定的效果.
推荐文章
基于C4.5决策树的视频车辆车型分类算法
C4.5决策树
层次化分类器
车型分类
一种基于变精度粗糙集的C4.5决策树改进算法
数据挖掘
决策树
信息增益率
C4.5算法
粗糙集
变精度粗糙集
近似分类质量
基于决策树C4.5集成算法的图像自动标注
C4.5算法
集成学习
修正矩阵
图像标注
基于改进C4.5算法的税收信用分类应用研究
决策树
C4.5算法
税收信用分类
经验值窗口分割
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于C4.5决策树分类算法的改进与应用
来源期刊 计算机技术与发展 学科 工学
关键词 决策树 数据概率 信息增益率 时间效率 改进算法
年,卷(期) 2020,(5) 所属期刊栏目 应用开发研究
研究方向 页码范围 185-189
页数 5页 分类号 TP301.6
字数 3877字 语种 中文
DOI 10.3969/j.issn.1673-629X.2020.05.035
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李春生 东北石油大学计算机与信息技术学院 56 125 6.0 8.0
2 刘澎 东北石油大学计算机与信息技术学院 5 18 2.0 4.0
3 刘小刚 东北石油大学计算机与信息技术学院 3 5 1.0 2.0
4 焦海涛 东北石油大学计算机与信息技术学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (224)
共引文献  (17)
参考文献  (17)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(6)
  • 参考文献(0)
  • 二级参考文献(6)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(13)
  • 参考文献(0)
  • 二级参考文献(13)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(12)
  • 参考文献(0)
  • 二级参考文献(12)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(15)
  • 参考文献(0)
  • 二级参考文献(15)
2010(18)
  • 参考文献(0)
  • 二级参考文献(18)
2011(14)
  • 参考文献(0)
  • 二级参考文献(14)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(27)
  • 参考文献(0)
  • 二级参考文献(27)
2014(12)
  • 参考文献(0)
  • 二级参考文献(12)
2015(19)
  • 参考文献(0)
  • 二级参考文献(19)
2016(14)
  • 参考文献(0)
  • 二级参考文献(14)
2017(20)
  • 参考文献(1)
  • 二级参考文献(19)
2018(20)
  • 参考文献(10)
  • 二级参考文献(10)
2019(7)
  • 参考文献(6)
  • 二级参考文献(1)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
决策树
数据概率
信息增益率
时间效率
改进算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导