基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现实世界大数据应用复杂多样,可能会同时包含不同特征的数据和计算,在这种情况下单一的计算模式多半难以满足整个应用的需求,因此需要考虑不同计算模式的混搭使用。混合计算模式之集大成者当属UCBerkeley AMPLab的Spark系统,其涵盖了几乎所有典型的大数据计算模式,包括迭代计算、批处理计算、内存计算、流式计算(Spark Streaming)、数据查询分析计算(Shark)、以及图计算(GraphX)。 Spark提供了一个强大的内存计算引擎,实现了优异的计算性能,同时还保持与Hadoop平台的兼容性。因此,随着系统的不断稳定和成熟, Spark有望成为与Hadoop共存的新一代大数据处理系统和平台。本文详细研究和分析了Spark生态系统,建立了基于Spark平台的混合计算模型架构,并说明通过spark生态系统可以有效地满足大数据混合计算模式的应用。
推荐文章
基于混合计算模型的分布式传感器网络数据收集
传感器网络
计算模型
数据收集
客户/服务端
移动代理
大数据环境下基于Spark的Bayes分类算法研究
大数据
Spark
并行流式化
贝叶斯分类
基于Spark的混合推荐算法研究
推荐算法
分布式计算
Spark
增量式更新
基于Spark GraphX和社交网络大数据的用户影响力分析
数据挖掘
社交网络大数据
Spark GraphX
用户影响力分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark的大数据混合计算模型
来源期刊 计算机系统应用 学科
关键词 大数据 混合计算模式 spark 弹性分布数据集
年,卷(期) 2015,(4) 所属期刊栏目 软件技术?算法
研究方向 页码范围 214-218
页数 5页 分类号
字数 3475字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 程家兴 安徽新华学院信息工程学院 93 1344 17.0 35.0
3 胡贤德 安徽新华学院信息工程学院 26 130 4.0 11.0
6 胡俊 安徽新华学院信息工程学院 8 100 2.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (87)
同被引文献  (166)
二级引证文献  (244)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(27)
  • 引证文献(20)
  • 二级引证文献(7)
2017(58)
  • 引证文献(26)
  • 二级引证文献(32)
2018(104)
  • 引证文献(20)
  • 二级引证文献(84)
2019(94)
  • 引证文献(15)
  • 二级引证文献(79)
2020(46)
  • 引证文献(4)
  • 二级引证文献(42)
研究主题发展历程
节点文献
大数据
混合计算模式
spark
弹性分布数据集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
总被引数(次)
57078
论文1v1指导