基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网技术的发展,每时每刻都在产生大量的数据,数据量已成为爆炸性增长的趋势,单机难以存储和分析这些数据.面对难以处理海量数据的单机现状,采用Hadoop分布式计算平台可以有效解决海量数据处理问题.但是Hadoop的MapReduce编程模型不仅操作单一,抽象层次较低难以上手,而且延时高,难以支持交互式数据处理和实时数据处理,加之其中间结果需存入HDFS对于迭代数据处理性能较差.Spark作为一个新兴的大数据梳理的引擎,除了提供了包括MapReduce在内的几十个算子,还提供了一个集群的分布式内存抽象,避免频繁使用IO操作并大大提高迭代速度.同时在现实世界大数据应用复杂多样的背景下,Spark丰富的生态圈使得Spark可以轻易的适用于各种场景.
推荐文章
基于Spark的医疗服务大数据 统计平台的应用
Spark
交互式分析平台
医疗服务
医疗大数据
统计系统原型
数据挖掘
Spark on Yarn模式的电信大数据处理平台
云计算
电信大数据
映射-规约
Yarn规范
Spark内存计算
大数据处理平台Spark及其生物医学应用
大数据
Spark
医学研究
生物医学信息学
基于Spark平台的离群数据并行挖掘算法
大数据技术
离群挖掘
Spark平台
并行挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark大数据计算平台
来源期刊 电子世界 学科
关键词 大数据 Spark 弹性分布式数据集 Spark生态圈
年,卷(期) 2018,(15) 所属期刊栏目 探索与观察
研究方向 页码范围 82,84
页数 2页 分类号
字数 1895字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姜学军 沈阳理工大学信息科学与工程学院 27 71 5.0 6.0
2 黄海新 沈阳理工大学自动化与电气工程学院 10 101 6.0 10.0
3 武枫 沈阳理工大学信息科学与工程学院 2 9 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (199)
参考文献  (3)
节点文献
引证文献  (5)
同被引文献  (9)
二级引证文献  (1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
大数据
Spark
弹性分布式数据集
Spark生态圈
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子世界
半月刊
1003-0522
11-2086/TN
大16开
北京市
2-892
1979
chi
出版文献量(篇)
36164
总下载数(次)
96
总被引数(次)
46655
论文1v1指导