基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 通过深度学习卷积神经网络进行3维目标检测的方法已取得巨大进展,但卷积神经网络提取的特征既缺乏不同区域特征的依赖关系,也缺乏不同通道特征的依赖关系,同时难以保证在无损空间分辨率的情况下扩大感受野.针对以上不足,提出了一种结合混合域注意力与空洞卷积的3维目标检测方法.方法 在输入层融入空间域注意力机制,变换输入信息的空间位置,保留需重点关注的区域特征;在网络中融入通道域注意力机制,提取特征的通道权重,获取关键通道特征;通过融合空间域与通道域注意力机制,对特征进行混合空间与通道的混合注意.在特征提取器的输出层融入结合空洞卷积与通道注意力机制的网络层,在不损失空间分辨率的情况下扩大感受野,根据不同感受野提取特征的通道权重后进行融合,得到全局感受野的关键通道特征;引入特征金字塔结构构建特征提取器,提取高分辨率的特征图,大幅提升网络的检测性能.运用基于二阶段的区域生成网络,回归定位更准确的3维目标框.结果 KITTI(A project of Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago)数据集中的实验结果表明,在物体被遮挡的程度由轻到高时,对测试集中的car类别,3维目标检测框的平均精度AP3D值分别为83.45%、74.29%、67.92%,鸟瞰视角2维目标检测框的平均精度APBEv值分别为89.61%、87.05%、79.69%;对pedestrian和cyclist类别,AP3D和APBEv值同样比其他方法的检测结果有一定优势.结论 本文提出的3维目标检测网络,一定程度上解决了3维检测任务中卷积神经网络提取的特征缺乏视觉注意力的问题,从而使3维目标检测更有效地运用于室外自动驾驶.
推荐文章
基于注意力时空解耦3D卷积LSTM的视频预测
视频预测
卷积LSTM
注意力机制
时空解耦
重采样
基于混合式注意力机制的语音识别研究
卷积
注意力机制
全局平均池化
长短期记忆网络
LAS模型
基于多层次注意力机制一维DenseNet音频事件检测
音频事件检测
深度学习
DenseNet
多层次注意力机制
具有全局特征的空间注意力机制
卷积神经网络
空间注意力机制
全局特征
特征融合
目标分类
目标检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 结合混合域注意力与空洞卷积的3维目标检测
来源期刊 中国图象图形学报 学科 工学
关键词 3维目标检测 注意力机制 空洞卷积 感受野 金字塔网络 卷积神经网络(CNN)
年,卷(期) 2020,(6) 所属期刊栏目 图像理解和计算机视觉
研究方向 页码范围 1221-1234
页数 14页 分类号 TP391.4
字数 12559字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 方志军 上海工程技术大学电子电气工程学院 31 86 5.0 8.0
2 高永彬 上海工程技术大学电子电气工程学院 12 14 2.0 3.0
3 严娟 上海工程技术大学电子电气工程学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
3维目标检测
注意力机制
空洞卷积
感受野
金字塔网络
卷积神经网络(CNN)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国图象图形学报
月刊
1006-8961
11-3758/TB
大16开
北京9718信箱
82-831
1996
chi
出版文献量(篇)
5906
总下载数(次)
17
总被引数(次)
131816
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导