基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
根据卷积神经网络的特点,提出了深度流水的FPGA加速方案,设计了卷积层的通用卷积电路。该卷积电路可以在一个时钟周期内获得一个计算结果。理论上,该方案对于MNIST数据集,在28×28个时钟周期内可以获得一幅图片的运算结果。针对网络训练过程的前向传播阶段,在网络结构和数据集相同的情况下,对GPU,FPGA,CPU进行了在计算效率和能耗之间的比较。其中在计算效率方面,50 MHz频率的FPGA就可以相较于GPU实现近5倍的加速,相较于12核的CPU实现8倍的加速。而在功耗方面,该FPGA的实现方案只有GPU版本的26.7%。
推荐文章
基于FPGA的卷积神经网络加速器
卷积神经网络
现场可编程门阵列
加速器
流水线
并行化
卷积神经网络的FPGA并行结构研究
卷积神经网络
现场可编程门阵列
并行结构
面向卷积神经网络的FPGA加速器架构设计
硬件加速器
现场可编程门阵列(FPGA)
卷积神经网络(CNN)
参数化架构
流水线
面向云端FPGA的卷积神经网络加速器的设计及其调度
卷积神经网络
现场可编程门阵列
高层次综合
加速器
调度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 卷积神经网络的FPGA并行加速方案设计
来源期刊 计算机工程与应用 学科 工学
关键词 卷积神经网络 现场可编程门阵列(FPGA) 深度流水 加速
年,卷(期) 2015,(8) 所属期刊栏目 理论研究、研发设计
研究方向 页码范围 32-36
页数 5页 分类号 TP391
字数 4792字 语种 中文
DOI 10.3778/j.issn.1002-8331.1405-0335
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨广文 清华大学计算机科学与技术系 54 540 12.0 22.0
2 方睿 清华大学计算机科学与技术系 3 40 1.0 3.0
3 刘加贺 清华大学计算机科学与技术系 1 40 1.0 1.0
4 薛志辉 清华大学计算机科学与技术系 1 40 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (40)
同被引文献  (34)
二级引证文献  (26)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(4)
  • 引证文献(4)
  • 二级引证文献(0)
2018(19)
  • 引证文献(18)
  • 二级引证文献(1)
2019(31)
  • 引证文献(16)
  • 二级引证文献(15)
2020(10)
  • 引证文献(0)
  • 二级引证文献(10)
研究主题发展历程
节点文献
卷积神经网络
现场可编程门阵列(FPGA)
深度流水
加速
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导