基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对Flink任务出现故障后因为全局卷回使流处理作业恢复效率低的问题,提出基于缓存队列的容错策略.在作业中找出恢复时间最长的算子作为关键算子,将其处理过的数据存储到缓存队列中,并为其进行主动备份,备份算子同时接受来自上游的数据以达到在故障后作业可以瞬时恢复的效果.为了解决主动备份带来的额外消耗,提出数据过滤算法,备份算子在每次处理数据前会到缓存组件中检索当前数据,以判断是否继续处理.当Flink算子自身出现故障后,利用策略中的缓存队列与Flink的JobManager将故障发生时的数据信息发送给备份算子,在备份算子接收到数据后,实现即时恢复的效果.利用4项评价指标对策略进行评估,结果表明,与Flink1.8的故障恢复模式相比,所提策略在Flink任务故障恢复速度上有显著提升,当故障次数分别为1、2、3、4时,恢复效率分别提高56.3%、51.3%、46.2%和45.8%;而在处理时延、CPU利用率以及内存使用率方面仅产生极小的代价.
推荐文章
基于动态备份的容错网格任务调度
网格计算
任务调度
容错
动态备份
查询优化器的面向对象框架
查询优化
面向对象
查询计划
基于SCO Unix双机容错热备份技术的实现
SCO Unix
双机容错热备份
系统配置
sentinel双机容错软件
星载SpaceWire网络备份容错协议设计
SpaceWire
timecode
冗余备份
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向Flink流处理框架的主动备份容错优化
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 Apache Flink 流处理容错 主动备份 故障恢复 缓存队列
年,卷(期) 2022,(2) 所属期刊栏目 计算机与控制工程|Computer and Control Engineering
研究方向 页码范围 297-305
页数 9页 分类号 TP316.4
字数 语种 中文
DOI 10.3785/j.issn.1008-973X.2022.02.010
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Apache Flink
流处理容错
主动备份
故障恢复
缓存队列
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
论文1v1指导