作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
如何能从海量数据中以更快速、高效、低成本的方式挖掘出有价值的信息成为如今数据挖掘技术面临的新课题。文中在研究Hadoop平台的特征和决策树的C4.5算法的过程中,决定在决策树算法领域中引入云计算思维,实现其在Ha-doop平台上的并行化,并且采用MapReduce模型来解决海量数据挖掘问题。最后用打高尔夫球的数据集对新的算法进行验证。实验结果表明对海量数据,基于Hadoop平台的决策树算法可以明显提高数据挖掘的效率,具有可观的高效性和可扩展性,在一定程度上解决了C4.5算法在处理海量数据时计算量大、构建决策树时间长的问题。
推荐文章
基于改进C4.5算法的税收信用分类应用研究
决策树
C4.5算法
税收信用分类
经验值窗口分割
基于C4.5决策树的视频车辆车型分类算法
C4.5决策树
层次化分类器
车型分类
数据挖掘C4.5算法的编程设计与增量学习改进
数据挖掘
分类
C4.5算法
增量学习
基于决策树C4.5集成算法的图像自动标注
C4.5算法
集成学习
修正矩阵
图像标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop平台的C4.5算法的分析与研究
来源期刊 计算机技术与发展 学科 工学
关键词 Hadoop MapReduce 数据挖掘 C4.5算法
年,卷(期) 2014,(11) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 83-86,90
页数 5页 分类号 TP301.6
字数 3621字 语种 中文
DOI 10.3969/j.issn.1673-629X.2014.11.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄刚 南京邮电大学计算机学院 66 823 12.0 27.0
2 孙媛 南京邮电大学计算机学院 2 17 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (32)
共引文献  (1166)
参考文献  (10)
节点文献
引证文献  (13)
同被引文献  (28)
二级引证文献  (24)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(8)
  • 参考文献(1)
  • 二级参考文献(7)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(6)
  • 参考文献(3)
  • 二级参考文献(3)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(3)
  • 引证文献(3)
  • 二级引证文献(0)
2016(6)
  • 引证文献(6)
  • 二级引证文献(0)
2017(4)
  • 引证文献(2)
  • 二级引证文献(2)
2018(14)
  • 引证文献(2)
  • 二级引证文献(12)
2019(9)
  • 引证文献(0)
  • 二级引证文献(9)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Hadoop
MapReduce
数据挖掘
C4.5算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导