基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
快速傅里叶变换(Fast Fourier Transform,FFT)是最重要的基础算法之一,在科学计算、信号处理、图像处理等领域都有着广泛的应用.随着这些应用领域对实时性需求的进一步提高,FFT算法面临着越来越高的性能要求.在现有的FFT算法库中,FFT算法的求解速度和计算精度受到一定程度的限制,而且也少有研究者对偶数基Cooley-Tukey FFT的高性能实现提出相应的优化策略并对技术进行深入研究.基于此,文中提出了一套针对偶数基的Cooley-Tukey FFT的优化策略和方法.首先构建一个SIMD(Single Instruction Multiple Data)友好、支持混合基的蝶形网络,然后根据偶数基旋转因子特性最大限度地降低蝶形计算的复杂度,接着通过SIMD汇编优化、汇编指令重排及选择、寄存器分配策略制定、高性能矩阵转置算法等方法来优化应用,最后实现一个高性能的FFT算法库.目前,最流行、应用最广的FFT有FFTW和Intel MKL.实验结果表明,在X86计算平台上,新提出的这套针对偶数基Cooley-Tukey FFT的技术所实现的FFT算法库的性能全面优于MKL和FFTW.所提出的这套高性能算法优化和实现技术体系,可推广到除偶数基以外的其他基的实现和优化上,为进一步的研究开发工作奠定一定的基础,进而突破FFT算法在硬件平台上的性能瓶颈,实现一套针对特定平台的高性能FFT算法库.
推荐文章
一种高性能1024点fft算法的电路设计
基-4FFT
CORDIC
双端口SRAM
双通道
FFT算法的一种FPGA实现
FFT
FPGA
蝶型运算
乒乓RAM结构
一种高性能的寄生供电方法
寄生供电
受控上拉
串行通信
1-Wire
一种按时间抽取的混合基实序列高效FFT算法
快速傅立叶变换
按时间抽取
混合基
实序列快速傅立叶变换
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种偶数基Cooley-Tukey FFT高性能实现方法
来源期刊 计算机科学 学科 工学
关键词 快速傅里叶变换算法 偶数基 蝶形计算优化 蝶形网络优化 SIMD汇编优化 高性能FFT库
年,卷(期) 2020,(1) 所属期刊栏目 计算机体系结构
研究方向 页码范围 31-39
页数 9页 分类号 TP311.52
字数 8227字 语种 中文
DOI 10.11896/jsjkx.190900179
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 贾海鹏 中国科学院计算技术研究所计算机体系结构国家重点实验室 11 94 5.0 9.0
2 袁良 中国科学院计算技术研究所计算机体系结构国家重点实验室 11 25 2.0 4.0
3 龚彤艳 贵州财经大学信息学院 2 1 1.0 1.0
7 张广婷 中国科学院计算技术研究所计算机体系结构国家重点实验室 3 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1965(1)
  • 参考文献(1)
  • 二级参考文献(0)
1967(1)
  • 参考文献(1)
  • 二级参考文献(0)
1984(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
快速傅里叶变换算法
偶数基
蝶形计算优化
蝶形网络优化
SIMD汇编优化
高性能FFT库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导