基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
稀疏矩阵Cholesky分解是求解大规模稀疏线性方程组的核心算法,也是求解过程中最耗时的部分.近年来,一系列并行算法通过图形处理器(GPU)获得了显著的加速比,然而,由于访存的不规则性以及任务间的大量数据依赖关系,稀疏矩阵Cholesky分解算法在GPU上的计算效率很低.文中实现了一种新的基于GPU的稀疏矩阵Cholesky分解算法.在数据组织方面,改进了稀疏矩阵超节点数据结构,通过超节点合并和分块控制计算粒度;在计算调度方面,将稀疏矩阵Cholesky分解过程映射为一系列的数据块任务,并设计了相应的任务生成与调度算法,在满足数据依赖性的前提下提高任务的并行性.实验结果表明,该算法能够显著提高稀疏矩阵Cholesky分解算法在GPU上的实现效率,在单个GPU上获得了相对4核CPU平台2.69~3.88倍的加速比.
推荐文章
行(列)对称矩阵的LDU分解与Cholesky分解
行(列)转置矩阵
行(列)对称矩阵
LDU分解
Cholesky分解
三对角分解
使用 GPU 加速计算矩阵的 Cholesky 分解
图形处理器
乔里斯基分解
加速比
混合算法
基于稀疏性非负矩阵分解的故障监测方法
故障监测
非负矩阵分解
主元分析
稀疏编码
统计过程监控
基于GPU的并行Cholesky分解及其应用
正定系统
Cholesky分解
并行计算
OpenCL框架
光束平差
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于GPU的稀疏矩阵Cholesky分解
来源期刊 计算机学报 学科 工学
关键词 稀疏矩阵 Cholesky分解 GPU
年,卷(期) 2014,(7) 所属期刊栏目 计算机系统体系结构
研究方向 页码范围 1445-1454
页数 10页 分类号 TP391
字数 8850字 语种 中文
DOI 10.3724/SP.J.1016.2014.01445
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 窦勇 国防科学与技术大学计算机学院 45 220 8.0 12.0
2 邹丹 国防科学与技术大学计算机学院 4 26 2.0 4.0
3 郭松 国防科学与技术大学计算机学院 6 41 3.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (20)
同被引文献  (42)
二级引证文献  (7)
1978(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1983(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1992(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(6)
  • 引证文献(6)
  • 二级引证文献(0)
2017(5)
  • 引证文献(4)
  • 二级引证文献(1)
2018(9)
  • 引证文献(7)
  • 二级引证文献(2)
2019(6)
  • 引证文献(3)
  • 二级引证文献(3)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
稀疏矩阵
Cholesky分解
GPU
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
论文1v1指导