基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对深度学习在高分辨率遥感图像下棕榈树检测方面所面临的准确率不高和检测效率低下的问题,从算法优化和异构硬件平台加速两方面提出一种有效可靠的解决办法.以YOLOv3目标检测算法为例,采用扩大特征选择、加大多尺度特征融合的优化策略,提高了算法对高分辨率的棕榈树的检测准确度.在前向推理过程中,许多应用场景在要求模型高性能的同时往往会有严格的功耗限制.针对这个问题,采用权重整形8位量化和计算核心复用的优化策略,设计了一个基于SIMD的高效卷积计算引擎.此外,对输入模块进行了加速改进,通过对输入图片进行维度变化、向量化处理后,以写队列的方式传送给输入模块,提高了总线带宽的利用率.实验结果表明,经过算法优化后的模型准确率达到了97.84%,在基于Intel Arria10的异构硬件平台上可以获得1.4 TOPS性能,与i9-9980XE CPU相比,性能是它的7.51倍,能效是其33.02倍,与Nvidia推理端专用加速器P40比,能效是其1.2倍.
推荐文章
变维度FFT硬件加速器结构设计及FPGA实现
FFT硬件加速器
FFT处理器
地址调整模块
FPGA
基于硬件加速的快速傅里叶变换
FFT
FPGA
单片机
硬件加速
基于FPGA的卷积神经网络硬件加速器设计空间探索研究
卷积神经网络硬件加速器
设计空间探索
细粒度流水线
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于FPGA的油棕检测和硬件加速设计及实现
来源期刊 计算机科学与探索 学科 工学
关键词 现场可编程逻辑门阵列(FPGA) 改进YOLOv3 棕榈树 硬件加速器
年,卷(期) 2021,(2) 所属期刊栏目 人工智能
研究方向 页码范围 315-326
页数 12页 分类号 TP391.41|TP751
字数 语种 中文
DOI 10.3778/j.issn.1673-9418.1912029
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
现场可编程逻辑门阵列(FPGA)
改进YOLOv3
棕榈树
硬件加速器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导