基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
综述了近年来基于MapReduce编程模型的大数据处理平台与算法的研究进展.首先介绍了12个典型的基于MapReduce的大数据处理平台,分析对比它们的实现原理和适用场景,抽象其共性;随后介绍基于MapReduce的大数据分析算法,包括搜索算法、数据清洗/变换算法、聚集算法、连接算法、排序算法、偏好查询、最优化算法、图算法、数据挖掘算法,将这些算法按照MapReduce实现方式分类,分析影响算法性能的因素;最后,将大数据处理算法抽象为外存算法,并对外存算法的特征加以梳理,提出了普适的外存算法性能优化方法的研究思路和问题,以供研究人员参考.具体包括优化外存算法的磁盘I/O、优化外存算法的局部性以及设计增量式迭代算法.现有的大数据处理平台和算法研究多集中在基于资源分配和任务调度的平台动态性能优化、特定算法并行化、特定算法性能优化等领域,所提出的外存算法性能优化属于静态优化方法,是现有研究的良好补充,为研究人员提供了广阔的研究空间.
推荐文章
机务大数据处理平台的设计与研究
民用航空
Hadoop
存储分析平台
大数据处理
基于R语言的大数据处理平台的设计与实现
R语言
大数据处理平台
EP1C6Q240C8
数据挖掘
大数据挖掘中的MapReduce并行聚类优化算法研究
大数据
MapReduce
并行化处理
聚类算法
数据挖掘
Map任务
智能交通大数据处理平台的构建
智能交通
大数据处理
平台构建
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 MapReduce大数据处理平台与算法研究进展
来源期刊 软件学报 学科 工学
关键词 大数据 MapReduce 外存算法 大数据处理 算法性能优化
年,卷(期) 2017,(3) 所属期刊栏目 大数据管理技术专刊
研究方向 页码范围 514-543
页数 30页 分类号 TP311
字数 25808字 语种 中文
DOI 10.13328/j.cnki.jos.005169
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于戈 东北大学计算机科学与工程学院 426 6587 38.0 64.0
2 宋杰 东北大学软件学院 39 690 14.0 25.0
3 鲍玉斌 东北大学计算机科学与工程学院 85 1496 22.0 36.0
4 毛克明 东北大学软件学院 12 128 4.0 11.0
5 孙宗哲 东北大学软件学院 3 104 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (105)
共引文献  (219)
参考文献  (36)
节点文献
引证文献  (86)
同被引文献  (247)
二级引证文献  (98)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(1)
  • 二级参考文献(1)
1990(4)
  • 参考文献(2)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(10)
  • 参考文献(1)
  • 二级参考文献(9)
2008(17)
  • 参考文献(2)
  • 二级参考文献(15)
2009(9)
  • 参考文献(1)
  • 二级参考文献(8)
2010(14)
  • 参考文献(4)
  • 二级参考文献(10)
2011(12)
  • 参考文献(3)
  • 二级参考文献(9)
2012(15)
  • 参考文献(5)
  • 二级参考文献(10)
2013(13)
  • 参考文献(3)
  • 二级参考文献(10)
2014(5)
  • 参考文献(3)
  • 二级参考文献(2)
2015(5)
  • 参考文献(4)
  • 二级参考文献(1)
2016(6)
  • 参考文献(6)
  • 二级参考文献(0)
2017(9)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(9)
  • 二级引证文献(0)
2017(9)
  • 引证文献(9)
  • 二级引证文献(0)
2018(41)
  • 引证文献(32)
  • 二级引证文献(9)
2019(76)
  • 引证文献(26)
  • 二级引证文献(50)
2020(58)
  • 引证文献(19)
  • 二级引证文献(39)
研究主题发展历程
节点文献
大数据
MapReduce
外存算法
大数据处理
算法性能优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
论文1v1指导