基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于基于软件端卷积神经网络的卷积运算难以满足现在的卷积神经网络对运算性能与功耗的要求,为了克服困难,本文设计了一种基于4 × 4卷积核的异步卷积加速算法来对卷积神经网络进行加速。采用AddTree的形式来实现kernel矩阵和pic矩阵的乘加运算,1个Add Tree计算单元是1个4 × 4的卷积核与相同大小的图片矩阵的数据做乘加运算得到一个特征值,采用多个Add Tree的并行计算方式可以大幅度提升卷积计算速率。实验结果表明,该加速算法还有不受时钟频率限制的优点,可以工作在任何时钟频率下,且单个计算单元的计算速度也十分的快,计算一个特征值的时间大约在500 ns左右,相对于软件端的计算速率提升了10倍左右。
推荐文章
卷积的一种快速算法分析
卷积
算法
多项式
一种3×3卷积器的设计
卷积
补码
算法
结构
基于并行卷积核交叉模块的卷积神经网络设计
卷积神经网络
网络改进
卷积核
图像分类
特征提取
结果分析
一种分段卷积快速算法的设计与实现
分段卷积
实时处理
重叠相加法
FPGA
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于4 × 4卷积核的异步卷积加速算法研究
来源期刊 软件工程与应用 学科 工学
关键词 卷积神经网络 并行 4 × 4卷积核
年,卷(期) 2018,(3) 所属期刊栏目
研究方向 页码范围 160-167
页数 8页 分类号 TP39
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张海涛 8 98 4.0 8.0
2 何安平 10 13 3.0 3.0
3 杨裔 10 45 4.0 6.0
4 李鹏飞 6 23 3.0 4.0
5 程海波 1 0 0.0 0.0
6 余旅莹 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
卷积神经网络
并行
4
×
4卷积核
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件工程与应用
双月刊
2325-2286
武汉市江夏区汤逊湖北路38号光谷总部空间
出版文献量(篇)
291
总下载数(次)
1
总被引数(次)
0
论文1v1指导