基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着混合异构平台的发展,出现了类型不一的加速设备,如何在混合异构平台中充分利用这些不同类型的设备,以及如何在多个计算设备之间部署深度学习模型,而且训练大型和复杂模型的重要性不断提高.数据并行(DP)是应用最广泛的并行化策略,但是如果数据并行训练中的设备数量不断增加,设备之间的通信开销就会成为瓶颈.此外,每个步骤因设备性能差异处理的批总量不同会导致精度损失,即需要更长的训练周期以收敛到期望的精度.这些因素会影响整体训练时间,并且会影响某些设备的运行效率.除了数据并行(DP),每个训练步骤都可以通过模型并行(M P)来加速.提出了一种适合混合异构平台的模型并行训练优化算法.首先,为解决混合异构平台中设备性能分布不均问题,提出了层级并行和通道并行混合的模型并行划分策略,同时通过合并一些性能偏低的设备来减少流水线的长度和缓解通信压力.然后为了优化设备间的流水效果,通过分析流水线建立时间占比和设备性能利用率对整体训练时间的影响,提出了一种可以使两者达到均衡状态的微批次划分方法.实验表明,通过本文方法优化之后的模型并行流水训练算法比传统的模型并行算法具有更好的加速比,在单一类型设备的异构平台上的训练性能加速比提升4% 左右,在混合异构平台的训练性能加速比要比没有使用优化方法之前提升7% 左右.
推荐文章
面向任务的TBB多核集群混合并行编程模型
多核集群
MPI
TBB
面向任务
混合编程
基于异构多核的CCA并行构件模型
并行计算
并行构件
异构多核处理器
并行构件模型
基于CPU-GPU异构并行的MOC中子输运计算并行效率优化研究
异构并行
特征线方法
中子输运计算
GPU
CUDA
面向大数据的并行分类混合算法研究
大数据
Map-Reduce
算法融合
并行分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向混合异构架构的模型并行训练优化方法
来源期刊 计算机工程与科学 学科 工学
关键词 混合异构 模型并行 微批次 设备差异
年,卷(期) 2021,(1) 所属期刊栏目 高性能计算
研究方向 页码范围 42-48
页数 7页 分类号 TP393.027
字数 语种 中文
DOI 10.3969/j.issn.1007-130X.2021.01.006
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
混合异构
模型并行
微批次
设备差异
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导