基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统决策树算法不能解决海量数据挖掘以及ID3算法的多值偏向问题,设计和实现了一种基于MapReduce架构的并行决策树分类算法.该算法采用属性相似度作为测试属性的选择标准来避免ID3算法的多值偏向问题,采用MapReduce模型来解决海量数据挖掘问题.在用普通PC搭建的Hadoop集群的实验结果表明:基于MapReduce的决策树算法可以处理大规模数据的分类问题,具有较好的可扩展性,在保证分类正确率的情况下能获得接近线性的加速比.
推荐文章
基于MapReduce的Bagging决策树优化算法
决策树
Bagging
MapReduce模型
大数据分析
准确性
新型偏好敏感决策树算法
决策树
偏好敏感
偏好度
属性选择
代价敏感
分类
改进的多关系决策树算法
多关系数据挖掘
多关系决策树
元组标志传播
背景属性
基于MapReduce的ID3决策树分类算法研究
云计算
数据挖掘
决策树
ID3
MapReduce
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于MapReduce的决策树算法并行化
来源期刊 计算机应用 学科 工学
关键词 MapReduce 属性相似度 Hadoop 决策树 ID3算法
年,卷(期) 2012,(9) 所属期刊栏目 先进计算
研究方向 页码范围 2463-2465,2469
页数 分类号 TP311.133.2
字数 4368字 语种 中文
DOI 10.3724/SP.J.1087.2012.02463
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陆秋 桂林理工大学信息科学与工程学院 8 65 3.0 8.0
2 程小辉 桂林理工大学信息科学与工程学院 91 420 10.0 16.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (104)
参考文献  (8)
节点文献
引证文献  (46)
同被引文献  (95)
二级引证文献  (83)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(6)
  • 参考文献(2)
  • 二级参考文献(4)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(3)
  • 参考文献(3)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(8)
  • 引证文献(8)
  • 二级引证文献(0)
2014(8)
  • 引证文献(5)
  • 二级引证文献(3)
2015(12)
  • 引证文献(9)
  • 二级引证文献(3)
2016(16)
  • 引证文献(7)
  • 二级引证文献(9)
2017(27)
  • 引证文献(5)
  • 二级引证文献(22)
2018(27)
  • 引证文献(5)
  • 二级引证文献(22)
2019(23)
  • 引证文献(6)
  • 二级引证文献(17)
2020(8)
  • 引证文献(1)
  • 二级引证文献(7)
研究主题发展历程
节点文献
MapReduce
属性相似度
Hadoop
决策树
ID3算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导