基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大多数图像处理算法都可利用GPU进行加速以达到更好的执行性能,但数据传输操作与核函数执行之间的调度策略问题仍是桎梏加速性能进一步提升的主要瓶颈.为了解决这个问题,通常采用GPU任务流将核函数执行与数据传输操作进行重叠,以隐藏部分数据传输与核函数执行耗时.但是,由于CUDA编程模型的特性以及GPU硬件资源的限制,在某些情况下,即使创建较多的任务流用于任务重叠,每个流上仍会存在串行执行的任务,导致加速效果无法进一步提升.因此,考虑利用CSS将待处理图像进行合并从而将单个流中的算子核函数及数据传输操作进行合并,以减少数据传输操作和核函数执行的固定代价及调用间隙.通过实验结果可知,提出的CSS结构不仅能在单流的情况下提高GPU图像处理算法执行性能,在多流的情况下其加速性能也得到了进一步提升,具有较好的实用性及可扩展性,适用于包含较多算子操作或较小尺寸图像批量处理的情况.此外,提出的方法对图像处理算法的GPU加速提供了新的研究思路.
推荐文章
一种适用于图像拼接的DSIFT算法研究
图像拼接
尺度不变特征提取算法
图像配准
图像融合
一种适用于多媒体传感器网络的图像拼接算法
无线多媒体传感器网络
图像拼接
分块搜索
加权平均融合
一种适用于数字图像处理的DSP片上系统
SIMD
片上系统
数字图像处理
向量处理器
一种适用于任意形状区域的快速孔洞填充算法
孔洞填充
计算机图形学
封闭图形区域
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种适用于GPU图像处理算法的合并存储结构
来源期刊 计算机工程与科学 学科 工学
关键词 图像处理 GPU CUDA流 合并存储结构 重叠
年,卷(期) 2020,(2) 所属期刊栏目 高性能计算
研究方向 页码范围 197-202
页数 6页 分类号 TP391
字数 3713字 语种 中文
DOI 10.3969/j.issn.1007-130X.2020.02.002
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (3)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(6)
  • 参考文献(1)
  • 二级参考文献(5)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(7)
  • 参考文献(0)
  • 二级参考文献(7)
2016(6)
  • 参考文献(1)
  • 二级参考文献(5)
2017(1)
  • 参考文献(0)
  • 二级参考文献(1)
2018(3)
  • 参考文献(3)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图像处理
GPU
CUDA流
合并存储结构
重叠
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导