基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大型实对称正定矩阵的 Cholesky 分解问题,给出其在图形处理器(GPU)上的具体实现。详细分析了 Volkov 计算Cholesky 分解的混合并行算法,并在此基础上依据自身计算机的 CPU 以及 GPU 的计算性能,给出一种更为合理的三阶段混合调度方案,进一步减少 CPU 的空闲时间以及避免 GPU 空闲情况的出现。数值实验表明,当矩阵阶数超过7000时,新的混合调度算法相比标准的 MKL 算法获得了超过5倍的加速比,同时对比原 Volkov 混合算法获得了显著的性能提升。
推荐文章
行(列)对称矩阵的LDU分解与Cholesky分解
行(列)转置矩阵
行(列)对称矩阵
LDU分解
Cholesky分解
三对角分解
基于GPU的并行Cholesky分解及其应用
正定系统
Cholesky分解
并行计算
OpenCL框架
光束平差
基于GPU加速的投影后变分壳模型计算
壳模型
投影后变分
GPU
OpenACC
基于GPU的COONS曲面片加速计算
Coons曲面片
GPU
片元程序
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 使用 GPU 加速计算矩阵的 Cholesky 分解
来源期刊 计算机应用与软件 学科 工学
关键词 图形处理器 乔里斯基分解 加速比 混合算法
年,卷(期) 2016,(9) 所属期刊栏目 算 法
研究方向 页码范围 284-287,305
页数 5页 分类号 TP361
字数 4118字 语种 中文
DOI 10.3969/j.issn.1000-386x.2016.09.066
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高火涛 武汉大学电子信息学院 52 457 12.0 19.0
2 沈聪 武汉大学电子信息学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (3)
参考文献  (3)
节点文献
引证文献  (3)
同被引文献  (8)
二级引证文献  (4)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
图形处理器
乔里斯基分解
加速比
混合算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导