基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
快速多极子方法(FMM)是一种求解N体问题的快速高效数值算法,在宇宙学和分子动力学等模拟中具有广泛的应用.申威SW26010是一款国产众核异构处理器,含260核心(4核组).基于申威SW26010的众核架构设计和实现了快速多极子方法,并对核心函数(尤其是最耗时的粒子对相互作用)系统地进行了性能优化,包括异步DMA、SIMD向量化、循环展开、内联汇编指令调整等.以粒子对相互作用为例,优化后代码的计算速度约为主核上运行的原始代码的400倍,每个核组上的浮点性能达到250 GFLOPS,即理论峰值性能的32.5%.
推荐文章
基于申威众核处理器的NSGA-Ⅱ并行和优化方法
申威众核处理器
NSGA-Ⅱ
并行遗传算法
多目标
并行优化
基于申威众核处理器的NSGA-Ⅱ并行和优化方法
申威众核处理器
NSGA-Ⅱ
并行遗传算法
多目标
并行优化
面向众核处理器的独立调试系统设计方法
硅调试
片上网络
踪迹数据
调试事件矩阵
时间戳
基于神威众核处理器的排列熵算法并行加速方法
排列熵
神威众核处理器
MPI
OpenACC
嵌入维数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 快速多极子方法在申威众核处理器上的实现和优化
来源期刊 计算机工程与科学 学科 工学
关键词 快速多极子方法 异构众核处理器 N体问题 性能优化
年,卷(期) 2019,(7) 所属期刊栏目 高性能计算
研究方向 页码范围 1161-1167
页数 7页 分类号 TP391.9|TP319
字数 5207字 语种 中文
DOI 10.3969/j.issn.1007-130X.2019.07.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姜金荣 中国科学院计算机网络信息中心 17 25 3.0 4.0
2 王武 中国科学院计算机网络信息中心 15 106 6.0 10.0
3 王舒扬 中国科学院计算机网络信息中心 1 0 0.0 0.0
7 孟虹松 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (9)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1986(3)
  • 参考文献(1)
  • 二级参考文献(2)
1987(3)
  • 参考文献(1)
  • 二级参考文献(2)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
快速多极子方法
异构众核处理器
N体问题
性能优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导