作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的决策树算法在单机平台上处理海量数据挖掘时,容易受到计算能力和存储能力的限制,所以存在耗时过长、容错性差、存储量小的缺点.而拥有高可靠性和高容错性的Hadoop平台的出现为决策树算法的并行化提供了新的思路.本文设计和实现了一种基于Hadoop平台的并行SPRINT分类算法.实验结果表明:基于Hadoop平台的SPRINT分类算法比没有进行并行化的SPRINT算法具有较好的分类正确率、较低的时间复杂度和较好的并行性能,并且能明显提高算法求最佳分裂点时的执行速度.
推荐文章
基于Hadoop平台的Spark快数据推荐算法分析与应用
Hadoop
Spark
快数据
ALS算法
PageRank算法
基于 Hadoop平台的并行特征匹配算法研究
分布式文件系统
大数据
特征匹配
并行扫描
一种基于Hadoop架构的并行挖掘算法研究
挖掘算法
Hadoop架构
SPRINT
并行化
决策树
MapReduce
基于Hadoop平台的图书推荐服务Apriori优化算法
Hadoop
云计算
图书推荐
DAG
Apriori算法
推荐算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop平台的SPRINT算法的分析与研究
来源期刊 南京师大学报(自然科学版) 学科 工学
关键词 Hadoop MapReduce 数据挖掘 决策树 SPRINT算法
年,卷(期) 2016,(4) 所属期刊栏目 数学与计算机科学
研究方向 页码范围 25-30
页数 6页 分类号 TP301.6
字数 4685字 语种 中文
DOI 10.3969/j.issn.1001-4616.2016.04.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄刚 南京邮电大学计算机学院软件学院 66 823 12.0 27.0
2 孙媛 南京邮电大学计算机学院软件学院 2 17 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (18)
参考文献  (6)
节点文献
引证文献  (4)
同被引文献  (8)
二级引证文献  (3)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(7)
  • 参考文献(1)
  • 二级参考文献(6)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(5)
  • 参考文献(2)
  • 二级参考文献(3)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(5)
  • 引证文献(3)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Hadoop
MapReduce
数据挖掘
决策树
SPRINT算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京师大学报(自然科学版)
季刊
1001-4616
32-1239/N
大16开
南京市宁海路122号南京师范大学
1955
chi
出版文献量(篇)
2319
总下载数(次)
4
总被引数(次)
17979
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导