原文服务方: 计算机测量与控制       
摘要:
随着VLSI技术的发展,在单芯片上集成若干个处理器核的思想成为现实,现代GPU就是一个典型的多核处理器设备;由于面向计算密集型的应用发展非常迅速,当前的GPU又具有了较强的通用计算能力;全文首先介绍了CUDA和稀疏矩阵的相关知识;基于矩阵的CSR表示格式,文章提出了三种CUDA模型下的程序优化方法;论文分析并实现了这三种程序优化方法,在Geforce 9600GT上的实验结果表明,最大可以实现4倍左右的加速比.
推荐文章
GPU矩阵乘法和FFT算法的性能优化
GPU程序设计
矩阵乘法
快速傅里叶变换
性能优化技术
浮点矩阵向量乘法的FPGA设计与优化
可重构计算
可编程逻辑门阵列
矩阵向量乘法
基于CUDA的矩阵乘法和FFT性能测试
矩阵乘法
快速傅里叶变换
并行计算
GPU通用计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于CUDA的稀疏矩阵与矢量乘法的优化
来源期刊 计算机测量与控制 学科
关键词 CUDA GPGPU CSR 并行计算 稀疏矩阵与矢量相乘
年,卷(期) 2010,(8) 所属期刊栏目
研究方向 页码范围 1906-1908,1912
页数 分类号 TP303
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 樊晓桠 西北工业大学航空微电子中心 170 1393 17.0 29.0
2 赵丽丽 西北工业大学航空微电子中心 11 124 6.0 11.0
3 周洪 西北工业大学航空微电子中心 2 16 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (6)
参考文献  (1)
节点文献
引证文献  (9)
同被引文献  (8)
二级引证文献  (12)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(5)
  • 引证文献(4)
  • 二级引证文献(1)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(3)
  • 引证文献(2)
  • 二级引证文献(1)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(3)
  • 引证文献(1)
  • 二级引证文献(2)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
CUDA
GPGPU
CSR
并行计算
稀疏矩阵与矢量相乘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机测量与控制
月刊
1671-4598
11-4762/TP
大16开
北京市海淀区阜成路甲8号
1993-01-01
出版文献量(篇)
0
总下载数(次)
0
总被引数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导