作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台。它立足于内存计算,从多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算范式,是罕见的全能选手。Spark已正式申请加入Apache孵化器,从灵机一闪的实验室“电火花”成长为大数据技术平台中异军突起的新锐。本文主要讲述Spark的设计思想。
推荐文章
大数据环境下基于Spark的Bayes分类算法研究
大数据
Spark
并行流式化
贝叶斯分类
Spark数据倾斜问题研究
大数据
Spark
数据倾斜
数据处理
Spark框架结合分布式KNN分类器的网络大数据分类处理方法
分类处理
Apache Spark
并行机制
数据挖掘
汉明损失
K最近邻
Spark框架下利用分布式NBC的大数据文本分类方法
文本分类
MapReduce
Spark框架
分布式
朴素贝叶斯分类器
机器学习
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark:大数据的“电光石火”
来源期刊 程序员 学科 工学
关键词 计算平台 电光 美国加州大学 APACHE 批量处理 数据仓库 兼收并蓄 数据技术
年,卷(期) 2013,(7) 所属期刊栏目
研究方向 页码范围 100-104
页数 5页 分类号 TP332
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴甘沙 12 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
计算平台
电光
美国加州大学
APACHE
批量处理
数据仓库
兼收并蓄
数据技术
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
程序员
月刊
1672-3252
11-5038/G2
16开
北京市朝阳区广顺北大街33号院1号楼福码
2-665
2000
chi
出版文献量(篇)
10184
总下载数(次)
35
总被引数(次)
6420
论文1v1指导