原文服务方: 微电子学与计算机       
摘要:
深度神经网络在图像语音智能化处理领域的应用越来越广泛,但其算子、参数类型多,计算、存储密集大的特点制约了在航空航天、移动智能终端等嵌入式场景中的应用.针对这一问题,提出了解耦输入数据流,进行高效流水并行处理的思路,设计了一种神经网络加速器指令控制系统.不同算子的输入数据循环分块后,对应到指令组配置中,多状态机协同完成指令信息三阶段分发控制,实现指令解析、数据输入、计算、数据输出四级并行流水,充分利用分块内的数据复用机会,减少访存带宽及流水周期空闲率.将其部署在ZCU102开发板上,测试中支持常见的多种神经网络层类型和宽范围参数配置.频率为200 M时,峰值算力800 GOPS,运行VGG16网络模型,实际测试运行算力为489.4 GOPS,功耗4.42 W,能效比为113.3 GOPS/W,优于调研对比的同类神经网络加速器和CPU、GPU.实验结果表明,分解数据流,采用指令调度实现高效并行流水的方法解决了通用性和能效比两大难题,基于此方法设计的指令控制系统,可为神经网络加速器的嵌入式平台应用提供方案.
推荐文章
稀疏卷积神经网络加速器设计
稀疏卷积神经网络
阵列运算
加速器
高能效比
基于FPGA的卷积神经网络加速器设计与实现
卷积神经网络
现场可编程门阵列
加速器
有限资源
面向云端FPGA的卷积神经网络加速器的设计及其调度
卷积神经网络
现场可编程门阵列
高层次综合
加速器
调度
漯河辐照加速器控制系统研制
电子直线加速器
可编程控制器
控制系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 神经网络加速器指令控制系统设计
来源期刊 学科 工学
关键词 深度神经网络 神经网络加速器 指令控制系统 通用性 能效比
年,卷(期) 2022,(8) 所属期刊栏目 计算机工程与应用
研究方向 页码范围 78-85
页数 7页 分类号 TP391.4
字数 语种 中文
DOI 10.19304/J.ISSN1000-7180.2021.1344
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度神经网络
神经网络加速器
指令控制系统
通用性
能效比
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
论文1v1指导