原文服务方: 计算机应用研究       
摘要:
由于并行计算框架Spark缓存替换算法的粗糙性,LRU(least recently used)算法并未考虑RDD的重复使用导致易把高重用数据块替换出内存且作业执行效率较低等问题.通过优化权重模型和改进替换策略,提出了一种高效RDD自主缓存替换策略(efficient RDD automatic cache,ERAC),包括高重用自主缓存算法和缓存替换分级算法,可实现高效RDD的自主缓存和缓存目标的分级替换.最后利用SNAP(Stanford Network Analysis Project)提供的标准数据集将ERAC和LRU、RA(register allocation)等算法进行了对比实验,结果显示ERAC算法能够有效提高Spark的内存利用率和任务执行效率.
推荐文章
一种Spark下分布式DBN并行加速策略
分布内存计算框架
缓存替换
范围分区
深度信念网络
数据倾斜
基于增量聚类的语义缓存替换策略
移动计算
语义缓存
替换策略
位置相关
增量聚类
内容中心网络中一种基于内容扩散的主动缓存机制
内容中心网络
扩散原理
主动缓存
内容流行度
一种结合动态写策略的磁盘Cache替换算法
磁盘Cache
写策略
LRU
LFU
替换算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark中一种高效RDD自主缓存替换策略研究
来源期刊 计算机应用研究 学科
关键词 Spark 弹性分布式数据集 缓存替换 内存资源利用
年,卷(期) 2020,(10) 所属期刊栏目 系统应用开发
研究方向 页码范围 3043-3047
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2019.06.0213
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 魏赟 30 128 6.0 10.0
2 丁宇琛 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (25)
参考文献  (9)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(7)
  • 参考文献(2)
  • 二级参考文献(5)
2016(3)
  • 参考文献(0)
  • 二级参考文献(3)
2017(6)
  • 参考文献(1)
  • 二级参考文献(5)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Spark
弹性分布式数据集
缓存替换
内存资源利用
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导