基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在异构计算平台的移植和优化过程中,数字图像处理算法的访存性能已成为制约系统性能的主要因素.为此,结合NVIDIA Tegra K1硬件架构特征和具体算法特性,从合并与向量化访存优化、全局访存bank和channel冲突消除等方面,对矩阵转置算法和拉普拉斯滤波算法在NVIDIA Tegra K1异构计算平台上的实现和访存性能优化进行研究.实验结果表明,采用优化方法后的矩阵转置算法和拉普拉斯滤波算法在NVIDIA Tegra K1异构计算平台上取得了较大的访存性能提升,并且具有较好的实时性.
推荐文章
基于TEGRA K1的实时信号处理示波器的设计
TEGRA K1
实时处理
示波器
数据采集
异构计算平台图像边缘检测算法优化研究
图像边缘检测
异构计算平台
向量化访存
数据本地化
条件分支优化
一种针对异构计算平台的编译期优化方法
编译优化
OpenCL
异构计算
冗余代码外提
异构计算平台激光雷达算法优化研究
粗粒度并行
负载不均衡
零复制
数据本地化
GPU优化
异构计算平台
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 NVIDIA Tegra K1异构计算平台访存优化研究
来源期刊 计算机工程 学科 工学
关键词 GPU优化 访存带宽 数据本地化 向量化 合并访问 拉普拉斯滤波算法
年,卷(期) 2016,(12) 所属期刊栏目 体系结构与软件技术
研究方向 页码范围 44-49
页数 6页 分类号 TP311.1
字数 4610字 语种 中文
DOI 10.3969/j.issn.1000-3428.2016.12.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 肖琳 北京联合大学应用科技学院 18 71 4.0 8.0
2 李威 北京联合大学自动化学院 2 6 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (37)
共引文献  (35)
参考文献  (9)
节点文献
引证文献  (4)
同被引文献  (7)
二级引证文献  (3)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(16)
  • 参考文献(1)
  • 二级参考文献(15)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
GPU优化
访存带宽
数据本地化
向量化
合并访问
拉普拉斯滤波算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导