基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
研究了Spark并行计算集群对于内存的使用行为,认为其主要工作是通过对内存行为进行建模与分析,并对内存的使用进行决策自动化,使调度器自动识别出有价值的弹性分布式数据集(RDD)并放入缓存。另外,也对缓存替换策略进行优化,代替了原有的近期最少使用(LRU)算法。通过改进缓存方法,提高了任务在资源有限情况下的运行效率,以及在不同集群环境下任务效率的稳定性。
推荐文章
Spark中一种高效RDD自主缓存替换策略研究
Spark
弹性分布式数据集
缓存替换
内存资源利用
Spark数据倾斜问题研究
大数据
Spark
数据倾斜
数据处理
基于面向对象的过程实时数据库引擎设计
实时数据库
面向对象技术
过程控制
边缘计算中数据分层的协同缓存策略
边缘计算
数据缓存
博弈论
分层协同
缓存价值
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark计算引擎的数据对象缓存优化研究
来源期刊 中兴通讯技术 学科 工学
关键词 并行计算 缓存 Spark RDD
年,卷(期) 2016,(2) 所属期刊栏目 专题:大数据分析处理与应用
研究方向 页码范围 23-27
页数 5页 分类号 TN929.5
字数 4547字 语种 中文
DOI 10.3969/j.issn.1009-6868.2016.02.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈康 清华大学计算机科学与技术系 23 188 7.0 13.0
2 王彬 清华大学计算机科学与技术系 40 467 11.0 21.0
3 冯琳 清华大学计算机科学与技术系 10 59 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (12)
同被引文献  (14)
二级引证文献  (24)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(8)
  • 引证文献(4)
  • 二级引证文献(4)
2019(17)
  • 引证文献(5)
  • 二级引证文献(12)
2020(8)
  • 引证文献(0)
  • 二级引证文献(8)
研究主题发展历程
节点文献
并行计算
缓存
Spark
RDD
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中兴通讯技术
双月刊
1009-6868
34-1228/TN
大16开
合肥市金寨路329号凯旋大厦12楼
1995
chi
出版文献量(篇)
2060
总下载数(次)
1
论文1v1指导