基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本专栏细心的读者已经了解了之前专栏中讨论的两个反向数组示例,可能对为什么共享存储器版本比全局存储器版本速度更快仍然感到困惑。请回想一下共享存储器版本reverseArray_multiblock_fast.cu,内核将数组数据从全局存储器复制到共享存储器,然后再复制回全局存储器,而较慢的内核reverseArray_multiblock.cu只将数据从全局存储器复制到全局存储器。因为全局存储器性能比共享存储器慢100-150倍,所以慢得多的全局存储器性能占据了两个示例的绝大部分运行时。为什么共享存储器版本更快?
推荐文章
存储器管理单元设计
存储器管理单元
虚拟地址
有效地址
物理地址
存储器类型的CDT构造Ⅰ
CDT
存储器类型
基础范畴
因子分解
并行处理
大容量存储器的优化设计
大容量存储器
网络连接存储
存储区域网络
松散耦合
动态扩展
存储器模块测试系统的设计
存储器模块
测试系统
数字波形发生器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 DDJ006:使用CUDA profiler探索全局存储器
来源期刊 程序员 学科 工学
关键词 共享存储器 PROFILER 性能比 版本 复制 REV 内核 数组
年,卷(期) 2009,(1) 所属期刊栏目
研究方向 页码范围 76-77
页数 2页 分类号 TP333
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
共享存储器
PROFILER
性能比
版本
复制
REV
内核
数组
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
程序员
月刊
1672-3252
11-5038/G2
16开
北京市朝阳区广顺北大街33号院1号楼福码
2-665
2000
chi
出版文献量(篇)
10184
总下载数(次)
35
总被引数(次)
6420
论文1v1指导