基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
深度神经网络DNN模型是人工神经网络ANN模型的重要分支,是深度学习的基础.近年来,由于计算机算力的提升和高性能计算技术的发展,使得通过增加DNN网络深度和模型复杂度来提高其特征提取和数据拟合的能力成为可能,从而使DN N在自然语言处理、自动驾驶和人脸识别等问题上显现了优势.然而海量的数据和复杂的模型大大提高了深度神经网络的训练开销,因此加速其训练过程成为了一项关键任务,其技术范围涵盖从底层电路设计到分布式算法设计等多个方面.国产天河三号原型机峰值速度的设计目标为百亿亿级,巨大的计算能力为DN N训练提供了潜在的契机.针对天河三号原型机ARM架构特点,采用PyTorch框架与MPI技术,针对单个MT-2000+计算节点、单个FT-2000+计算节点,以及通过拓展的多节点集群设计CNN训练策略,并对上述处理器在神经网络分布式训练的性能做出了评测和优化,为进一步提升和改进天河三号原型机在神经网络大规模分布式训练方面的表现提供了实验数据和理论依据.
推荐文章
分布控制的乘坐式仿形采茶原型机研制与试验
采茶机
仿形
分布式控制
快速控制原型
非线性跟踪微分器
神经网络求解偏微分方程的分布式算法
人工神经网络
分布式算法
静态热传导方程
并行尺度裁切的深度卷积神经网络模型
并行卷积神经网络
识别
尺度裁切
特征提取
AlexNet
结合神经网络的微电网分布式模型预测控制
微电网
分布式模型预测控制
风力发电子系统
光伏发电子系统
蓄电池
神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 天河三号原型机分布式并行深度神经网络性能评测及调优
来源期刊 计算机工程与科学 学科
关键词 天河三号原型机 深度学习 分布式训练 性能评测 数据并行
年,卷(期) 2021,(5) 所属期刊栏目 高性能计算
研究方向 页码范围 782-791
页数 10页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1007-130X.2021.05.003
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (50)
共引文献  (9)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(6)
  • 参考文献(0)
  • 二级参考文献(6)
2013(5)
  • 参考文献(0)
  • 二级参考文献(5)
2014(12)
  • 参考文献(0)
  • 二级参考文献(12)
2015(9)
  • 参考文献(1)
  • 二级参考文献(8)
2016(7)
  • 参考文献(4)
  • 二级参考文献(3)
2017(4)
  • 参考文献(3)
  • 二级参考文献(1)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
天河三号原型机
深度学习
分布式训练
性能评测
数据并行
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导