基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对计算流体力学(Computational Fluid Dynamics,CFD)程序CNS提出一种Offload模式下对任务内外子区域划分的异构并行算法,结合结构化网格下有限差分计算和四阶龙格-库塔方法的特点,引入ghost网格点区域,设计了一种ghost区域收缩计算策略,显著降低了异构计算资源之间的数据传输开销,负载均衡时CPU端的计算与MPI通信完全和加速器端的计算重叠,提高了异构协同并行性.推导了保证计算正确性的ghost区域的参数,分析了负载均衡的条件.在"CPU(Intel Haswell Xeon E5-267012 cores×2)+加速器(Xeon Phi 7120A×2)"的服务器上测得该算法较直接将任务子块整体迁至加速器端计算的异构算法性能平均提升至5.9倍,较MPI/OpenMP两级并行算法使用24个纯CPU核的性能,该算法使用单加速器时加速至1.27倍,使用双加速器加速至1.45倍.讨论和分析了性能瓶颈与存在的问题.
推荐文章
RadauⅠ A方法的并行算法
隐式Radau Ⅰ A方法
并行算法
绝对稳定区域
边界轨迹法
数据挖掘中新的并行算法
数据挖掘
关联规则
并行算法
大项集
集群计算机上基于BSP模型的并行算法及其程序设计
BSP模型
并行算法
集群计算机
并行算法设计
基于CPU-GPU异构并行的MOC中子输运计算并行效率优化研究
异构并行
特征线方法
中子输运计算
GPU
CUDA
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高精度CFD程序的内外子区域划分异构并行算法
来源期刊 国防科技大学学报 学科 工学
关键词 高精度CFD程序 四阶龙格-库塔法 异构并行算法 内外子区域划分 性能分析
年,卷(期) 2020,(2) 所属期刊栏目 专题:高性能计算
研究方向 页码范围 31-40
页数 10页 分类号 TN95
字数 9057字 语种 中文
DOI 10.11887/j.cn.202002004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐传福 国防科技大学计算机学院量子信息研究所兼高性能计算国家重点实验室 11 129 5.0 11.0
2 车永刚 国防科技大学计算机学院量子信息研究所兼高性能计算国家重点实验室 18 52 5.0 6.0
3 王巍 国防科技大学计算机学院量子信息研究所兼高性能计算国家重点实验室 9 79 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (17)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(5)
  • 参考文献(5)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
高精度CFD程序
四阶龙格-库塔法
异构并行算法
内外子区域划分
性能分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
国防科技大学学报
双月刊
1001-2486
43-1067/T
大16开
湖南省长沙市开福区德雅路109号
42-98
1956
chi
出版文献量(篇)
3593
总下载数(次)
5
总被引数(次)
31889
论文1v1指导