原文服务方: 现代电子技术       
摘要:
当前GPU的体系结构为高性能计算提供了良好的可编程性.为了得到众核GPU高性能程序设计的一般方法,探索GPU程序性能优化技术,对在GPU上进行高性能程序设计的经验进行了总结.通过基准测试,得到GPU性能指标,对GPU程序设计进行指导.使用CUDA对单精度矩阵乘法和FFT进行性能优化,前一个算法是计算密集型任务,后一个算法是带宽密集型任务.在NVIDIA GeForce GTX280 GPU上,矩阵乘法算法达到393 Gflop/s的峰值速度,比CUBLAS 2.0数学库提高了5%;对于一些维度的FFT计算也取得了较好的性能.
推荐文章
缓存结构GPU矩阵乘法算法的自动优化
GPU程序设计
矩阵乘法
自动优化
GEMM模板
缓存结构GPU矩阵乘法算法的自动优化
GPU程序设计
矩阵乘法
自动优化
GEMM模板
基于CUDA的矩阵乘法和FFT性能测试
矩阵乘法
快速傅里叶变换
并行计算
GPU通用计算
大数乘法的GPU加速实现
大数乘法
图形处理器
全同态加密
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 GPU矩阵乘法和FFT算法的性能优化
来源期刊 现代电子技术 学科
关键词 GPU程序设计 矩阵乘法 快速傅里叶变换 性能优化技术
年,卷(期) 2013,(4) 所属期刊栏目 科学计算及信息处理
研究方向 页码范围 80-84
页数 5页 分类号 TN911-34|TP312
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李晓雯 防空兵学院指挥控制系 3 11 2.0 3.0
2 崔翔 河南大学计算机与信息工程学院 7 14 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (295)
参考文献  (6)
节点文献
引证文献  (7)
同被引文献  (19)
二级引证文献  (8)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(12)
  • 参考文献(0)
  • 二级参考文献(12)
2004(8)
  • 参考文献(2)
  • 二级参考文献(6)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(3)
  • 引证文献(3)
  • 二级引证文献(0)
2015(3)
  • 引证文献(1)
  • 二级引证文献(2)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
GPU程序设计
矩阵乘法
快速傅里叶变换
性能优化技术
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代电子技术
半月刊
1004-373X
61-1224/TN
大16开
1977-01-01
chi
出版文献量(篇)
23937
总下载数(次)
0
总被引数(次)
135074
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导