基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
稀疏矩阵向量乘(SpMV)是科学与工程计算中一个重要的核心函数,但在当前基于存储器层次结构的计算平台上,传统CSR(Compressed Sparse Row)存储的稀疏矩阵向量乘性能较低,运行效率往往远低于硬件浮点峰值的10%.目前现有的处理器架构一般都采用SIMD向量化技术进行加速,但是传统CSR格式的稀疏矩阵向量乘由于访存的不规则性,不能直接采用向量化技术进行加速,为了利用SIMD技术,对具有局部性特征的稀疏矩阵,提出了新的稀疏矩阵存储格式CSRL(Compressed Sparse Row with Local information),该格式可以减少SpMV时内存访问次数,并且能够充分利用硬件的SIMD向量化技术进行读取和计算,提高了SpMV性能.实验表明,该方法相比国际著名商业库Intel MKL10.3版平均性能提升达到29.5%,最高可达89%的性能提升.
推荐文章
基于FPGA的稀疏矩阵向量乘的设计研究
稀疏矩阵向量乘
现场可编程逻辑门阵列
可重构计算
并行算法
基于分块存储格式的稀疏线性系统求解优化
GPU加速
共轭梯度
稳定双共轭梯度
重排序
HMEC存储格式
稀疏矩阵与向量乘
基于GPU的高效稀疏矩阵存储格式研究
图像处理单元
CUSPARSE库
HEC存储格式
稀疏矩阵与向量乘
不完全LU分解
预条件共轭梯度法
一种基于剪切的SLP向量化方法
单指令多数据扩展部件
自动向量化
超字并行
代价模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种提高SpMV向量化性能的新型稀疏矩阵存储格式
来源期刊 数值计算与计算机应用 学科
关键词 稀疏矩阵 稀疏矩阵向量乘 向量化 局部性 CSRL
年,卷(期) 2014,(4) 所属期刊栏目
研究方向 页码范围 269-276
页数 分类号
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨超 中国科学院软件研究所并行软件与计算科学实验室 114 799 15.0 23.0
5 刘芳芳 中国科学院软件研究所并行软件与计算科学实验室 13 88 4.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (13)
参考文献  (2)
节点文献
引证文献  (7)
同被引文献  (12)
二级引证文献  (2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
稀疏矩阵
稀疏矩阵向量乘
向量化
局部性
CSRL
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数值计算与计算机应用
季刊
1000-3266
11-2124/TP
16开
北京市海淀区中关村东路55号
2-413
1980
chi
出版文献量(篇)
771
总下载数(次)
2
论文1v1指导