基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
声子玻尔兹曼输运方程(BTE)可以有效地模拟介观尺度下的导热问题,相比于随机性方法,以有限体积法为代表的确定性方法求解声子BTE方程被认为更有希望解决工程实际问题.但是有限体积法求解BTE具有迭代步数多,迭代时间长的问题.为此提出了声子BTE方程迭代求解部分在GPU上的并行加速方案,并设计适当的线程分配方式及数据存储格式,采用循环展开和内核融合等优化手段对迭代过程进行并行加速.此外,采用基于角方向的并行策略,使用MPI+CUDA、CUDA-Aware MPI和NCCL函数的方式实现了声子BTE求解多GPU并行版本.实验结果表明,相较于Intel Xeon Gold 6248上的串行版本,在单块V100 GPU上获得了最大31.5倍的加速.同时使用NCCL函数的GPU并行版本在8台DGX-2节点共计128块V100 GPU上最高达到了83%的并行效率,比MPI+CUDA版本提升57%.
推荐文章
机翼结构布局优化的并行子空间方法
机翼结构
布局优化
并行子空间
系统级协调
一维搜索
高压下铜的声子谱和弹性系数
密度泛函微扰论
铜高压声子谱
嵌入原子势(EAM)
复合材料加筋板结构优化设计的并行子空间法
复合材料
加筋板
布局优化
并行子空间优化方法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 声子BTE应用的并行和优化研究
来源期刊 计算机科学与探索 学科 工学
关键词 并行加速 玻尔兹曼输运方程(BTE) DGX-2 统一计算设备架构(CUDA)
年,卷(期) 2020,(8) 所属期刊栏目 高性能计算
研究方向 页码范围 1288-1297
页数 10页 分类号 TP391
字数 7821字 语种 中文
DOI 10.3778/j.issn.1673-9418.1909072
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 林新华 上海交通大学高性能计算中心 29 59 5.0 6.0
2 文敏华 上海交通大学高性能计算中心 13 22 3.0 4.0
3 韦建文 上海交通大学高性能计算中心 13 41 3.0 6.0
4 刘永志 上海交通大学高性能计算中心 5 19 3.0 4.0
5 鲍华 上海交通大学密西根学院 5 2 1.0 1.0
6 胡跃 上海交通大学密西根学院 1 0 0.0 0.0
7 沈泳星 上海交通大学密西根学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
并行加速
玻尔兹曼输运方程(BTE)
DGX-2
统一计算设备架构(CUDA)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导