基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
"神威·太湖之光"是我国全自主研发的千万核超级计算机,目前已有很多大型应用程序在此先进架构上进行了移植优化.然而,高能物理领域的格点量子色动力学(LQCD)数值模拟软件在神威平台上尚未进行过移植优化,这引起了科学工作者们的关注.针对LQCD在神威平台上的移植优化问题展开研究.首先,论述了国内外对LQCD在不同硬件架构上进行并行优化的发展历程.其次,通过对其热点模块Dslash的重构,实现了在神威平台上的成功移植.再次,针对申威26010芯片异构众核的架构和并行模式,实现了从核阵列异构并行、从核本地设备存储器(LDM)与主存之间的直接存储访问(DMA)通讯、主核之间的消息传递接口(MPI)通讯及全局归约等操作.最后,经过实验测试,单核组优化程序与16核组优化程序相比单主核程序分别获得了165倍和25倍的加速比,并发现了一些重要的性能瓶颈问题,为进一步优化提升整体效率奠定重要基础.同时,对国产超算平台的推广使用具有积极意义.
推荐文章
基于神威太湖之光的NAMD软件的移植与优化
分子动力学模拟
神威超级计算机
异构多核处理器
基于"神威太湖之光"的Caffe分布式扩展研究
深度学习
分布式优化
Caffe
神威太湖之光
一种面向神威·太湖之光的通用并行卷积算法
神威·太湖之光
卷积神经网络
数据重用
软件流水
批量受限
基于神威·太湖之光的非结构网格众核优化技术
离散访存
非结构网格
通量计算
异构众核优化
并行排序
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 LQCD Dslash在神威·太湖之光上的研究分析与MPI实现
来源期刊 计算机科学与探索 学科 工学
关键词 格点量子色动力学(LQCD) Dslash 消息传递接口(MPI) 神威·太湖之光 众核芯片
年,卷(期) 2019,(10) 所属期刊栏目 高性能计算
研究方向 页码范围 1664-1676
页数 13页 分类号 TP391
字数 9509字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 何钦铭 浙江大学计算机科学与技术学院 62 1404 16.0 37.0
2 陈建海 浙江大学计算机科学与技术学院 12 24 3.0 4.0
3 张淼 浙江大学计算机科学与技术学院 4 22 3.0 4.0
4 周宇 浙江大学计算机科学与技术学院 8 22 3.0 4.0
5 徐顺 中国科学院计算机网络信息中心 7 6 1.0 2.0
6 宫明 中国科学院高能物理研究所 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1974(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
格点量子色动力学(LQCD)
Dslash
消息传递接口(MPI)
神威·太湖之光
众核芯片
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导