原文服务方: 西安交通大学学报       
摘要:
针对手工优化GPU(Graphic Processing Unit)显存级数据复用过程复杂和编译时优化数据复用开销过大的问题,提出了一种基于动态生成树在运行时进行数据复用的优化方法,可为程序员提供一种透明且高效简单的优化方式.该方法将已经执行的GPU计算任务的数据访问抽象为生成树的叶子节点,利用动态生成树管理GPU数据访问信息,实现了运行时GPU显存级数据的复用优化,并通过运行时对生成树的搜索和维护,动态地发掘和优化GPU显存级数据复用,因此,在编程时不需要进行复杂且困难的数据复用分析,直接调用文中提出的运行时库就能有效减少程序执行过程中CPU内存和GPU显存之间的冗余数据传输次数,从而提升应用的运行性能.实验结果表明,使用文中提出的优化方法可有效消除未进行数据复用优化的CPU-GPU应用程序中的冗余数据传输,最大加速比达原始执行的3~10倍,额外开销不到优化后程序总执行时间的5%.
推荐文章
基于道路树分层的大电网潮流并行算法及其GPU优化实现
潮流计算
并行计算
图形处理器
稀疏线性方程组
道路树
基于GPU的并行八叉树生成算法
八叉树
GPU加速
并行
基于GPU的并行最小生成树算法的设计与实现
图形处理器
图论
最小生成树
Prim算法
数据并行原语
GPU解码数据快速拷贝的应用研究
H.264
USWC
硬解码
DXVA
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 应用动态生成树的GPU显存数据复用优化
来源期刊 西安交通大学学报 学科
关键词 GPU显存 动态生成树 数据复用 数据传输
年,卷(期) 2013,(10) 所属期刊栏目
研究方向 页码范围 44-50
页数 7页 分类号 TP399
字数 语种 中文
DOI 10.7652/xjtuxb201310008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱正东 西安交通大学电子与信息工程学院 23 95 6.0 8.0
2 董小社 西安交通大学电子与信息工程学院 114 962 16.0 24.0
3 李亮 西安交通大学电子与信息工程学院 76 653 14.0 21.0
4 王恩东 12 16 3.0 3.0
5 张保 西安交通大学电子与信息工程学院 4 32 3.0 4.0
6 颜康 西安交通大学电子与信息工程学院 2 5 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (13)
参考文献  (6)
节点文献
引证文献  (3)
同被引文献  (15)
二级引证文献  (3)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
GPU显存
动态生成树
数据复用
数据传输
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
总被引数(次)
81310
论文1v1指导