基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对现有RGB-D室内场景语义分割不能有效融合多模态特征的问题,提出一种基于注意力机制和金字塔融合的RGB-D室内场景图像语义分割网络模型APFNet,并为其设计了两个新模块:注意力机制融合模块与金字塔融合模块.其中,注意力机制融合模块分别提取RGB特征和Depth特征的注意力分配权重,充分利用两种特征的互补性,使网络聚焦于信息含量更高的多模态特征域;金字塔融合模块利用四种不同金字塔尺度特征,融合局部与全局信息,提取场景语境,提升物体边缘和小尺度物体的分割精度.将这两个融合模块整合到一个包含三个分支的"编码器-解码器"网络中,实现"端到端"输出.该模型在SUN RGB-D和NYU Depth v2数据集上与多层残差特征融合网络(RDF-152)、注意力互补网络(ACNet)、空间信息引导卷积网络(SGNet)等先进方法进行实验对比.实验结果表明,与最好的表现方法RDF-152对比,APFNet的编码器网络层数从152层降低到50层的情况下,像素精度(PA)、平均像素精度(MPA)、平均交并比(MIoU)分别提升了0.4、1.1、3.2个百分点,并对枕头、照片等小尺度物体和木板、天花板等大尺度物体的语义分割质量分别有0.9~4.5和12.4~18个百分点的提升;故该模型在处理室内场景语义分割问题上具有一定的优势.
推荐文章
基于注意力机制的全景分割网络
全景分割
背景类实例重叠
三重态注意力机制
语义增强注意力机制
基于RGB-D图像的室内场景语义分割网络优化
RGB-D图像
语义分割
深度学习
卷积神经网络
一种由粗至精的RGB-D室内场景语义分割方法
RGB-D室内场景
语义分割
SLIC过分割
稠密CRFs
递归式反馈
稀疏字典驱动高阶依赖的RGB-D室内场景语义分割
语义分割
条件随机场模型
稀疏字典学习
结构化支持向量机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于注意力机制和金字塔融合的RGB-D室内场景语义分割
来源期刊 计算机应用 学科 工学
关键词 RGB-D语义分割 注意力机制 金字塔融合 多模态 深层监督
年,卷(期) 2022,(3) 所属期刊栏目 人工智能|Artificial intelligence
研究方向 页码范围 844-853
页数 10页 分类号 TP391.4
字数 语种 中文
DOI 10.11772/j.issn.1001-9081.2021030392
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
RGB-D语义分割
注意力机制
金字塔融合
多模态
深层监督
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导