基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
多核与众核已成为当前主流的高性能计算体系结构,OpenMP编程是开发其并行计算能力的主要手段之一。针对一个实际高阶精度结构网格CFD(computational fluids dynamics)应用程序,采用基于硬件计数器的性能测试和模型分析的方法,系统地研究了其在Intel Xeon E5 Sandy Bridge多核处理器和Intel Knights Corner集成众核协处理器上的OpenMP性能。重点分析了OpenMP库开销、线程负载均衡性、主存访问带宽对性能的影响,发现因OpenMP并行引入的冗余计算对并行效率影响很小,但串行计算部分和负载不均衡性对并行效率影响大,主存访问带宽对浮点性能的影响大。还比较了该程序两种体系结构上的性能差异,讨论了性能进一步优化的方向。
推荐文章
基于OpenMP的电磁场FDTD多核并行程序设计
OpenMP
时域有限差分法
多核并行程序
程序设计
基于JNI和C++的Intel集成众核并行方法
集成众核
并行计算
Java native interface
基于OpenMP的电磁场FDTD并行程序性能分析
OpenMP
并行程序
FDTD
影响因素
Cilk++与OpenMP并行模型性能比较
蚁群算法
TBB
Cilk++
OpenMP
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Intel多核与集成众核上CFD程序的OpenMP性能分析
来源期刊 计算机科学与探索 学科 工学
关键词 多核 集成众核 CFD应用程序 OpenMP 性能分析
年,卷(期) 2015,(10) 所属期刊栏目 高性能计算
研究方向 页码范围 1153-1162
页数 10页 分类号 TP311
字数 6780字 语种 中文
DOI 10.3778/j.issn.1673-9418.1412057
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐传福 国防科技大学计算机学院 11 129 5.0 11.0
2 车永刚 国防科技大学并行与分布处理重点实验室 18 52 5.0 6.0
6 王勇献 国防科技大学并行与分布处理重点实验室 26 140 7.0 11.0
10 程兴华 国防科技大学计算机学院 14 44 4.0 6.0
11 张理论 国防科技大学并行与分布处理重点实验室 16 67 6.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (2)
参考文献  (4)
节点文献
引证文献  (8)
同被引文献  (9)
二级引证文献  (1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(6)
  • 引证文献(6)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
多核
集成众核
CFD应用程序
OpenMP
性能分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导