基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在OpenCL并行计算框架的clMAGMA库中, Cholesky分解算法采用大尺寸分块并行方法, 不能充分利用GPU的高速局部存储器, 且在计算过程中存在多次GPU-CPU间的数据传递.为此, 提出采用小尺寸分块并行方法, 充分利用GPU中的高速局部存储器, 使矩阵子块的逆矩阵得到复用, 完成对称正定矩阵的高效Cholesky分解, 并且其能够应用于三维视觉光束平差问题中的大型正定矩阵的分解.实验结果表明, 该方法的Cholesky分解速度比clMAGMA提升50%以上, 针对光束平差问题, 比Ceres Solver中使用的Eigen库速度提升约38倍.
推荐文章
使用 GPU 加速计算矩阵的 Cholesky 分解
图形处理器
乔里斯基分解
加速比
混合算法
基于GPU的模态分析并行算法
子空间迭代
图形处理器
模态
并行计算
有限元
基于FPGA的Cholesky分解矩阵求逆
空时自适应处理
乔洛斯基分解
矩阵求逆
卷帘行存储下的一种并行Cholesky分解及其在PAR95上的实现
对称矩阵
并行处理
Cholesky分解
卷帘存储
MPP处理机系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于GPU的并行Cholesky分解及其应用
来源期刊 计算机工程 学科 工学
关键词 正定系统 Cholesky分解 并行计算 OpenCL框架 光束平差
年,卷(期) 2019,(2) 所属期刊栏目 开发研究与工程应用
研究方向 页码范围 284-289
页数 6页 分类号 TP361
字数 4489字 语种 中文
DOI 10.19678/j.issn.1000-3428.0049718
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 戴瑜兴 湖南大学电气与信息工程学院 240 2348 23.0 36.0
3 沈雁 湖南大学电气与信息工程学院 7 15 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (6)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1978(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(7)
  • 参考文献(2)
  • 二级参考文献(5)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
正定系统
Cholesky分解
并行计算
OpenCL框架
光束平差
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导