基于注意力机制和金字塔融合的RGB-D室内场景语义分割

余娜; 刘彦; 魏雄炬; 万源

文献导航

搜索文章

搜索思路

钛学术文献服务平台 \
学术期刊 \
工业技术期刊 \
自动化技术与计算机技术期刊 \
计算机应用期刊 \
基于注意力机制和金字塔融合的RGB-D室内场景语义分割

基于注意力机制和金字塔融合的RGB-D室内场景语义分割

作者：

余娜刘彦魏雄炬万源

基本信息来源于合作网站，原文需代理用户跳转至来源网站获取

RGB-D语义分割

注意力机制

金字塔融合

多模态

深层监督

摘要：

针对现有RGB-D室内场景语义分割不能有效融合多模态特征的问题,提出一种基于注意力机制和金字塔融合的RGB-D室内场景图像语义分割网络模型APFNet,并为其设计了两个新模块:注意力机制融合模块与金字塔融合模块.其中,注意力机制融合模块分别提取RGB特征和Depth特征的注意力分配权重,充分利用两种特征的互补性,使网络聚焦于信息含量更高的多模态特征域;金字塔融合模块利用四种不同金字塔尺度特征,融合局部与全局信息,提取场景语境,提升物体边缘和小尺度物体的分割精度.将这两个融合模块整合到一个包含三个分支的"编码器-解码器"网络中,实现"端到端"输出.该模型在SUN RGB-D和NYU Depth v2数据集上与多层残差特征融合网络(RDF-152)、注意力互补网络(ACNet)、空间信息引导卷积网络(SGNet)等先进方法进行实验对比.实验结果表明,与最好的表现方法RDF-152对比,APFNet的编码器网络层数从152层降低到50层的情况下,像素精度(PA)、平均像素精度(MPA)、平均交并比(MIoU)分别提升了0.4、1.1、3.2个百分点,并对枕头、照片等小尺度物体和木板、天花板等大尺度物体的语义分割质量分别有0.9～4.5和12.4～18个百分点的提升;故该模型在处理室内场景语义分割问题上具有一定的优势.

内容分析

关键词云

关键词热度

相关文献

推荐文献

根据相关规定，获取原文需跳转至原文服务方进行注册认证身份信息

完成下面三个步骤操作后即可获取文献，阅读后请点击下方页面【继续获取】按钮

钛学术文献服务平台

学术出版新技术应用与公共服务实验室出品

原文合作方

获取文献流程

1.访问原文合作方请等待几秒系统会自动跳转至登录页，首次访问请先注册账号，填写基本信息后，点击【注册】

2.注册后进行实名认证，实名认证成功后点击【返回】

3.检查邮箱地址是否正确，若错误或未填写请填写正确邮箱地址，点击【确认支付】完成获取，文献将在1小时内发送至您的邮箱

*若已注册过原文合作方账号的用户，可跳过上述操作，直接登录后获取原文即可

点击【获取原文】按钮，跳转至合作网站。

首次获取需要在合作网站进行注册。

注册并实名认证，认证后点击【返回】按钮。

确认邮箱信息，点击【确认支付】，订单将在一小时内发送至您的邮箱。

* 若已经注册过合作网站账号，请忽略第二、三步，直接登录即可。

期刊分类
期刊（年）
期刊（期）
期刊推荐

一般工业技术交通运输军事科技冶金工业动力工程化学工业原子能技术大学学报建筑科学无线电电子学与电信技术机械与仪表工业水利工程环境科学与安全科学电工技术石油与天然气工业矿业工程自动化技术与计算机技术航空航天轻工业与手工业金属学与金属工艺

计算机应用2022 计算机应用2021 计算机应用2020 计算机应用2019 计算机应用2018 计算机应用2017 计算机应用2016 计算机应用2015 计算机应用2014 计算机应用2013 计算机应用2012 计算机应用2011 计算机应用2010 计算机应用2009 计算机应用2008 计算机应用2007 计算机应用2006 计算机应用2005 计算机应用2004 计算机应用2003 计算机应用2002 计算机应用2001 计算机应用2000 计算机应用1999

计算机应用2022年第3期计算机应用2022年第2期计算机应用2022年第1期

按字母查找期刊：

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他

联系合作广告推广: shenyukuan@paperpass.com

篇名	基于注意力机制和金字塔融合的RGB-D室内场景语义分割
来源期刊	计算机应用	学科	工学
关键词	RGB-D语义分割注意力机制金字塔融合多模态深层监督
年，卷（期）	2022,（3）	所属期刊栏目	人工智能\|Artificial intelligence
研究方向		页码范围	844-853
页数	10页	分类号	TP391.4
字数		语种	中文
DOI	10.11772/j.issn.1001-9081.2021030392