基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对高效视频编解码标准中后处理CNN算法在通用平台运行时产生的高延时缺点, 提出一种基于现场可编程逻辑门阵列 (FPGA) 的后处理卷积神经网络硬件并行架构.提出的并行架构通过改进输入与输出缓冲的数据并发过程, 调整卷积模块整体并行度, 加快模块硬件流水.实验结果表明, 基于本文所提出的并行架构设计的CNN硬件加速器在Xilinx ZCU102上处理分辨率为176×144视频流, 计算性能相当于每秒360.5GFLOPS, 计算速度可满足81.01FPS, 相比时钟频率4GHz的Intel i7-4790K, 计算速度加快了76.67倍, 相比NVIDIA GeForce GTX 750Ti加速了32.50倍.在计算能效比方面, 本文后处理CNN加速器功耗为12.095J, 能效比是Intel i7-4790K的512.90倍, 是NVIDIA GeForce GTX750Ti的125.78倍.
推荐文章
基于FPGA的卷积神经网络硬件加速器设计空间探索研究
卷积神经网络硬件加速器
设计空间探索
细粒度流水线
变维度FFT硬件加速器结构设计及FPGA实现
FFT硬件加速器
FFT处理器
地址调整模块
FPGA
一种KNN算法的可重构硬件加速器设计
K近邻算法
现场可编程门阵列
可重构硬件
并行计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于FPGA的HEVC后处理CNN硬件加速器研究
来源期刊 计算机工程与科学 学科 工学
关键词 高清视频编解码后处理 卷积神经网络 现场可编程逻辑门阵列 硬件实现
年,卷(期) 2018,(12) 所属期刊栏目 高性能计算
研究方向 页码范围 2126-2132
页数 7页 分类号 TP303
字数 5542字 语种 中文
DOI 10.3969/j.issn.1007-130X.2018.12.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 严伟 北京大学软件与微电子学院 46 301 10.0 15.0
2 柴志雷 江南大学物联网工程学院 61 462 10.0 20.0
3 钱磊 9 13 2.0 3.0
4 夏珺 江南大学物联网工程学院 5 5 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
高清视频编解码后处理
卷积神经网络
现场可编程逻辑门阵列
硬件实现
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导