基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 语义分割是计算机视觉中一项具有挑战性的任务,其核心是为图像中的每个像素分配相应的语义类别标签.然而,在语义分割任务中,缺乏丰富的多尺度信息和足够的空间信息会严重影响图像分割结果.为进一步提升图像分割效果,从提取丰富的多尺度信息和充分的空间信息出发,本文提出了一种基于编码—解码结构的语义分割模型.方法 运用ResNet-101网络作为模型的骨架提取特征图,在骨架末端附加一个多尺度信息融合模块,用于在网络深层提取区分力强且多尺度信息丰富的特征图.并且,在网络浅层引入空间信息捕获模块来提取丰富的空间信息.由空间信息捕获模块捕获的带有丰富空间信息的特征图和由多尺度信息融合模块提取的区分力强且多尺度信息丰富的特征图将融合为一个新的信息丰富的特征图集合,经过多核卷积块细化之后,最终运用数据依赖的上采样(DUpsampling)操作得到图像分割结果.结果 此模型在2个公开数据集(Cityscapes数据集和PASCAL VOC 2012数据集)上进行了大量实验,验证了所设计的每个模块及整个模型的有效性.新模型与最新的10种方法进行了比较,在Cityscapes数据集中,相比于RefineNet模型、DeepLabv2-CRF模型和LRR(Laplacian reconstruction and refinement)模型,平均交并比(mIoU)值分别提高了0.52%、3.72%和4.42%;在PASCAL VOC 2012数据集中,相比于Piecewise模型、DPN(deep parsing network)模型和GCRF(Gaussion conditional random field network)模型,mIoU值分别提高了6.23%、7.43%和8.33%.结论 本文语义分割模型,提取了更加丰富的多尺度信息和空间信息,使得分割结果更加准确.此模型可应用于医学图像分析、自动驾驶、无人机等领域.
推荐文章
基于增强多尺度特征解码器的图像语义分割
语义分割
轻量级网络模型
解码器
特征提取网络
多尺度特征
语义分割图像自适应编码方法
语义分割
图像压缩
支持向量机
算术编码
基于多尺度编码-解码网络的皮肤病变图像分割
皮肤病变
多尺度编码-解码网络
SegNet
二进制双线性插值
融合语义与几何特征的人体模型结构分割
形状分析
人体模型
测地线距离
层次划分
空间体积
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 编码—解码结构的语义分割
来源期刊 中国图象图形学报 学科 工学
关键词 语义分割 克罗内克卷积 多尺度信息 空间信息 注意力机制 编码—解码结构 Cityscapes数据集 PASCAL VOC 2012数据集
年,卷(期) 2020,(2) 所属期刊栏目 图像处理与编码
研究方向 页码范围 255-266
页数 12页 分类号 TP391.4
字数 7020字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王建平 合肥工业大学电气与自动化工程学院 177 1643 23.0 31.0
2 李帷韬 合肥工业大学电气与自动化工程学院 19 81 5.0 8.0
6 孙百顺 合肥工业大学电气与自动化工程学院 2 1 1.0 1.0
7 焦点 合肥工业大学电气与自动化工程学院 2 0 0.0 0.0
8 韩慧慧 合肥工业大学电气与自动化工程学院 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
语义分割
克罗内克卷积
多尺度信息
空间信息
注意力机制
编码—解码结构
Cityscapes数据集
PASCAL VOC 2012数据集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国图象图形学报
月刊
1006-8961
11-3758/TB
大16开
北京9718信箱
82-831
1996
chi
出版文献量(篇)
5906
总下载数(次)
17
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导