基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
卷积神经网络CNN目前作为神经网络的一个重要分支, 相比于其他神经网络方法更适合应用于图像特征的学习和表达.随着CNN的不断发展, CNN将面临更多的挑战.CNN参数规模变得越来越大, 这使得CNN对计算的需求量变得非常大.因此, 目前产生了许多种方式对CNN的规模进行压缩.然而压缩后的CNN模型往往产生了许多稀疏的数据结构, 这种稀疏结构会影响CNN在GPU上的性能.为了解决该问题, 采用直接稀疏卷积算法, 来加速GPU处理稀疏数据.根据其算法特点将卷积运算转换为稀疏向量与稠密向量内积运算, 并将其在GPU平台上实现.本文的优化方案充分利用数据稀疏性和网络结构来分配线程进行任务调度, 利用数据局部性来管理内存替换, 使得在稀疏卷积神经网络SCNN中的GPU仍能够高效地处理卷积层运算.相比cuBLAS的实现, 在AlexNet、GoogleNet、ResNet上的性能提升分别达到1.07×~1.23×、1.17×~3.51×、1.32×~5.00×的加速比.相比cuSPARSE的实现, 在AlexNet、GoogleNet、ResNet上的性能提升分别达到1.31×~1.42×、1.09×~2.00×、1.07×~3.22×的加速比.
推荐文章
卷积稀疏自编码神经网络
卷积神经网络
稀疏自编码
反卷积
种群稀疏
存在稀疏
高分散性稀疏
基于稀疏卷积神经网络的考生识别算法
考生识别
卷积神经网络
人脸识别
身份验证
多通道输入
方法比
深度卷积神经网络的多GPU并行框架
深度卷积神经网络
GPU
并行框架
图像识别
大数据
基于卷积神经网络的人脸识别研究综述
卷积神经网络
人脸识别
深度学习
特征提取
分类器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于GPU的高性能稀疏卷积神经网络优化
来源期刊 计算机工程与科学 学科 工学
关键词 卷积神经网络 稀疏 并行 优化 图形处理器
年,卷(期) 2018,(12) 所属期刊栏目 高性能计算
研究方向 页码范围 2103-2111
页数 9页 分类号 TP183
字数 6552字 语种 中文
DOI 10.3969/j.issn.1007-130X.2018.12.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邢座程 国防科技大学计算机学院 19 107 6.0 10.0
2 方程 国防科技大学计算机学院 7 80 3.0 7.0
3 张洋 国防科技大学计算机学院 4 10 2.0 3.0
4 陈顼颢 国防科技大学计算机学院 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
卷积神经网络
稀疏
并行
优化
图形处理器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导