基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
NVIDIA在其GPU平台上开发的FFT库CUFFT经过几次升级,但在二维FFT实现上效率还有提升空间,而且对于特定不能与上下文的计算融合,导致多次对Global memory的访问。本文分析合并内存访问事务大小与占用率之间的关系,优化使用GPU存储器资源,对小数据量2次幂二维复数FFT在GPU上的实现进行改进,加速比最高达到CUFFT 6.5的1.27倍。利用实数FFT结果的共轭对称性,算法的效率比复数FFT算法运算量降低了40%。最后将FFT的改进应用到光学传递函数(OTF)的计算中,采用Kernel 融合的方法,使得OTF的计算效率比CUFFT计算方法提高了1.5倍。
推荐文章
基于GPU的快速二维沃尔什变换研究
图形处理器
计算统一设备体系结构
沃尔什变换
一种二维离散余弦变换系数快速算法
离散余弦变换
离散哈脱莱变换
复杂度
降低
快速
改进的快速短时傅里叶变换算法在跳频信号分析中的应用
跳频
哈特莱变换
傅里叶变换
时频分析
利用MATLAB实现二维图像傅立叶变换算法
傅立叶变换算法
Matlab
二维图像重建
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 GPU平台二维快速傅里叶变换算法实现及应用
来源期刊 光电工程 学科 工学
关键词 快速傅里叶变换 CUDA 光学传递函数 图形处理器
年,卷(期) 2016,(2) 所属期刊栏目 ?图像与信号处理?
研究方向 页码范围 69-75
页数 7页 分类号 TP391
字数 4048字 语种 中文
DOI 10.3969/j.issn.1003-501X.2016.02.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张全 中国科学院自适应光学重点实验室 67 434 12.0 16.0
13 饶长辉 中国科学院自适应光学重点实验室 114 890 16.0 22.0
17 鲍华 中国科学院自适应光学重点实验室 10 53 5.0 6.0
21 彭真明 电子科技大学光电信息学院 67 1103 20.0 30.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (60)
参考文献  (3)
节点文献
引证文献  (9)
同被引文献  (7)
二级引证文献  (8)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(4)
  • 引证文献(3)
  • 二级引证文献(1)
2019(7)
  • 引证文献(3)
  • 二级引证文献(4)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
快速傅里叶变换
CUDA
光学传递函数
图形处理器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
光电工程
月刊
1003-501X
51-1346/O4
大16开
四川省成都市双流350信箱
1974
chi
出版文献量(篇)
4776
总下载数(次)
5
总被引数(次)
44377
论文1v1指导