基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对一般稀疏矩阵-矩阵乘法(SpGEMM)的性能问题,提出了一种基于任务分类和低延迟散列表的图形处理器上的加速SpGEMM算法RBSPARSE.该算法由一种低成本子任务复杂度预分析方法和一种低延迟共享内存上的散列表的方法组成,以达到最大效率.通过解决负载均衡和内存延迟问题,RBSPARSE可以显著减少计算的总时间.比较了RBSparse和BHSparse,前者是最快的SpGEMM算法,结果表明RBSparse的性能是BHSparse的平均3.1倍,在最佳情况下可达到14.49倍.
推荐文章
GPU矩阵乘法和FFT算法的性能优化
GPU程序设计
矩阵乘法
快速傅里叶变换
性能优化技术
基于CUDA的稀疏矩阵与矢量乘法的优化
CUDA
GPGPU
CSR
并行计算
稀疏矩阵与矢量相乘
GPU矩阵乘法和FFT算法的性能优化
GPU程序设计
矩阵乘法
快速傅里叶变换
性能优化技术
2×2酉矩阵的一般形式
2×2酉矩阵
分解
一般形式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高性能行任务散列法GPU一般稀疏矩阵-矩阵乘法
来源期刊 北京邮电大学学报 学科 工学
关键词 稀疏矩阵-矩阵乘法 图形处理器 性能优化 散列表 共享内存
年,卷(期) 2019,(3) 所属期刊栏目 研究报告
研究方向 页码范围 106-113
页数 8页 分类号 TP391
字数 语种 中文
DOI 10.13190/j.jbupt.2018-252
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 戴志涛 北京邮电大学智能通信软件与多媒体北京市重点实验室 12 45 4.0 6.0
5 汤洋 北京邮电大学理学院 1 0 0.0 0.0
6 赵达非 北京邮电大学智能通信软件与多媒体北京市重点实验室 1 0 0.0 0.0
10 黄智濒 北京邮电大学智能通信软件与多媒体北京市重点实验室 4 4 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (1)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
稀疏矩阵-矩阵乘法
图形处理器
性能优化
散列表
共享内存
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京邮电大学学报
双月刊
1007-5321
11-3570/TN
大16开
北京海淀区西土城路10号
2-648
1960
chi
出版文献量(篇)
3472
总下载数(次)
19
论文1v1指导