基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
卷积神经网络(CNN)凭借其优秀的表现正在诸如图像分类、语音识别等领域里扮演着越来越重要的角色,已经有一些研究人员想要将这个深度学习过程复制到手机上.但是,由于CNN巨大的计算量,移植程序的性能一直难以令人满意.为了探讨如何解决这一问题,借助MXNet这样一个深度学习的框架在手机上实现了CNN的前向过程,并且将注意力放在了使用手机上另一个强大的计算设备——GPU上.最终选择使用OpenCL通用编程框架将前向过程中最耗时的卷积操作利用矩阵乘来完成,并转移到GPU上进行.在此基础之上还针对手机GPU做了一些优化.最终,实验结果显示我们成功地将前向过程的时间降低到了原来时间的一半.
推荐文章
GPU加速MOC输运计算性能分析研究
GPU加速
特征线方法
中子输运计算
统一计算设备构架
性能分析
卷积神经网络CNN算法在文本分类上的应用研究
数据挖掘
机器学习
卷积神经网络
文本分类
航空CFD流场计算多GPU并行加速技术研究
CFD
并行计算方法
GPU
高性能计算机
基于GPU的反卷积算法并行优化
并行
反卷积
GPU
CUDA
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 CNN卷积计算在移动GPU上的加速研究
来源期刊 计算机工程与科学 学科 工学
关键词 CNN 手机 移动GPU 快速算法 OpenCL
年,卷(期) 2018,(1) 所属期刊栏目 高性能计算
研究方向 页码范围 34-39
页数 6页 分类号 TP391.4
字数 4095字 语种 中文
DOI 10.3969/j.issn.1007-130X.2018.01.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 文梅 国防科技大学计算机学院 16 49 4.0 6.0
2 王湘新 1 7 1.0 1.0
3 时洋 国防科技大学计算机学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (2)
参考文献  (3)
节点文献
引证文献  (7)
同被引文献  (6)
二级引证文献  (1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(5)
  • 引证文献(5)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
CNN
手机
移动GPU
快速算法
OpenCL
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导