基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的Stockham FFT计算框架和Cooley-Tukey FFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓冲以及SIMD向量化等与计算平台相关的优化方法来提高FFT的计算性能.最后对所提出算法的性能进行了测试,相比于单主核上运行的FFTW3.3.4库,获得了平均44.53x的加速比,最高加速比可达56.33x,且其带宽利用率最高可达83.45%.
推荐文章
基于申威众核处理器的NSGA-Ⅱ并行和优化方法
申威众核处理器
NSGA-Ⅱ
并行遗传算法
多目标
并行优化
快速多极子方法在申威众核处理器上的实现和优化
快速多极子方法
异构众核处理器
N体问题
性能优化
面向申威众核处理器的LZMA并行算法设计与优化
并行计算
异构众核处理器
LZMA
压缩算法
基于申威26010处理器的扩展函数库实现与优化
浮点运算
数学函数
申威26010处理器
数据分段
指令调度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 申威26010众核处理器上一维FFT实现与优化
来源期刊 软件学报 学科 工学
关键词 申威26010处理器 一维FFT 两层分解 Cooley-Tukey 众核并行
年,卷(期) 2020,(10) 所属期刊栏目 算法设计与分析
研究方向 页码范围 3184-3196
页数 13页 分类号 TP301
字数 语种 中文
DOI 10.13328/j.cnki.jos.005848
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (0)
参考文献  (12)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1965(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(3)
  • 参考文献(2)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
申威26010处理器
一维FFT
两层分解
Cooley-Tukey
众核并行
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
论文1v1指导