基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
状态可变数据流(Mutable States Data Flow,MS-DF)是机器学习系统运行时的主要特征,MS-DF可由有向图来表示,其顶点由算子构成,表示机器学习运算逻辑;边代表算子之间的输入输出依赖关系.MS-DF的集群调度是保障机器学习系统高效运行的主要工作,如何高效进行MS-DF的集群调度已经成为机器学习的研究热点.其中,机器学习系统(TensorFlow、PyTorch等)作为中间层解耦了机器学习运算逻辑和资源分配(CPU,GPU,FGPA),从而机器学习无需再"独占式"静态绑定资源,而是由机器学习系统运行时动态管理,而算子是该解耦过程的关键要素,这给MS-DF的集群调度带来了新的挑战,这些挑战主要由算子资源需求刻画的准确性、算子调度决策的适应性和算子调度调整的差异性这三方面导致的.首先介绍算子资源需求的感知、协同两个机制,以克服多种算子组合导致其自身资源需求难以准确刻画的挑战;然后,通过决策约束、决策模型和决策求解来介绍算子调度决策,以应对算子状态频繁变化带来的适应性挑战;接着,介绍迁移、伸缩、挂起恢复等算子调度调整策略,以适用于不同算子状态同步方式带来的差异性挑战.最后,基于上述三个挑战,对近年来的集群调度最新研究成果进行归纳和分析,并展望MS-DF的集群调度,指出算子异构资源需求多层次分析及协同刻画、算子复杂调度约束的灵活定义和发现、学习驱动的算子低成本调度调整技术是其主要发展方向.
推荐文章
面向数据流的频繁模式挖掘研究
数据流
数据挖掘
数据流挖掘
频繁模式
数据流系统降载研究综述
数据流系统
降栽
数据流管理系统
窗口
数据流操作符实时调度策略研究
数据流
操作符
调度策略
服务质量
基于数据流的移动数据挖掘研究综述
移动数据挖掘
数据挖掘
数据流
普适计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向状态可变数据流的集群调度综述
来源期刊 计算机学报 学科 工学
关键词 机器学习系统 状态可变数据流 机器学习算子 算子资源需求刻画 算子调度决策 算子调度调整
年,卷(期) 2022,(5) 所属期刊栏目
研究方向 页码范围 973-992
页数 20页 分类号 TP311
字数 语种 中文
DOI 10.11897/SP.J.1016.2022.00973
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
机器学习系统
状态可变数据流
机器学习算子
算子资源需求刻画
算子调度决策
算子调度调整
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
北京市自然科学基金
英文译名:Natural Science Foundation of Beijing Province
官方网址:http://210.76.125.39/zrjjh/zrjj/
项目类型:重大项目
学科类型:
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导