基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
首先介绍了CUDA架构特点,在GPU上基于CUDA使用两种方法实现了矩阵乘法,并根据CUDA特有的软硬件架构对矩阵乘法进行了优化。然后计算GPU峰值比并进行了分析。实验结果表明,基于CUDA的矩阵乘法相对于CPU矩阵乘法获得了很高的加速比,最高加速比达到1079.64。GPU浮点运算能力得到有效利用,峰值比最高达到30.85%。
推荐文章
基于CUDA的稀疏矩阵与矢量乘法的优化
CUDA
GPGPU
CSR
并行计算
稀疏矩阵与矢量相乘
基于CUDA架构的FDK算法的研究
三维锥束CT
FDK算法
图像处理器
CUDA
基于CUDA架构并行设计图像去噪算法
CUDA
图像去噪
K-SVD
图形处理器
并行优化
矩阵拉伸
基于CUDA的矩阵乘法和FFT性能测试
矩阵乘法
快速傅里叶变换
并行计算
GPU通用计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于CUDA架构矩阵乘法的研究
来源期刊 微型机与应用 学科 工学
关键词 CUDA 矩阵乘法 加速比 峰值比
年,卷(期) 2011,(24) 所属期刊栏目 技术与方法
研究方向 页码范围 62-64,68
页数 分类号 TP301
字数 3039字 语种 中文
DOI 10.3969/j.issn.1674-7720.2011.24.022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘羽 桂林理工大学信息科学与工程学院 29 105 6.0 8.0
2 马梦琦 桂林理工大学信息科学与工程学院 2 8 2.0 2.0
3 曾胜田 桂林理工大学信息科学与工程学院 2 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (32)
参考文献  (2)
节点文献
引证文献  (4)
同被引文献  (5)
二级引证文献  (12)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(7)
  • 引证文献(0)
  • 二级引证文献(7)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
CUDA
矩阵乘法
加速比
峰值比
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术与网络安全
月刊
2096-5133
10-1543/TP
大16开
北京市海淀区清华东路25号(北京927信箱)
82-417
1982
chi
出版文献量(篇)
10909
总下载数(次)
33
总被引数(次)
35987
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导