基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 在基于深度学习的图像语义分割方法中,损失函数通常只考虑单个像素点的预测值与真实值之间的交叉熵并对其进行简单求和,而引入图像像素间的上下文信息能够有效提高图像的语义分割的精度,但目前引入上下文信息的方法如注意力机制、条件随机场等算法需要高昂的计算成本和空间成本,不能广泛使用.针对这一问题,提出一种流形正则化约束的图像语义分割算法.方法 以经过数据集ImageNet预训练的残差网络(resid-ual network,ResNet)为基础,采用DeepLabV3作为骨架网络,通过骨架网络获得预测分割图像.进行子图像块的划分,将原始图像和分割图像分为若干大小相同的图像块.通过原始图像和分割图像的子图像块,计算输入数据与预测结果所处流形曲面上的潜在几何约束关系.利用流形约束的结果优化分割网络中的参数.结果 通过加入流形正则化约束,捕获图像中上下文信息,降低了网络前向计算过程中造成的本征结构的损失,提高了算法精度.为验证所提方法的有效性,实验在Cityscapes和PASCAL VOC 2012(pattern analysis,statistical modeling and computa-tional learning visual object classes)两个数据集上进行.在Cityscapes数据集中,精度值为78.0%,相比原始网络提高了0.5%;在PASCAL VOC 2012数据集中,精度值为69.5%,相比原始网络提高了2.1%.同时,在Cityscapes数据集中进行对比实验,验证了算法的有效性,对比实验结果证明提出的算法改善了语义分割的效果.结论 本文提出的语义分割算法在不提高推理网络计算复杂度的前提下,取得了较好的分割精度,具有极大的实用价值.
推荐文章
基于图像分层树的图像语义分割方法
语义分割
图像分层树
多尺度
随机森林
支持向量机
基于高阶CRF模型的图像语义分割
计算机视觉
图像语义分割
条件随机场模型
高阶能量项
基于可形变部件模型
核化图正则子空间分割方法
子空间分割
核理论
图正则
聚类
Sylvester方程
非线性结构
语义分割图像自适应编码方法
语义分割
图像压缩
支持向量机
算术编码
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 流形正则化约束的图像语义分割
来源期刊 中国图象图形学报 学科 工学
关键词 深度学习 语义分割 残差网络(ResNet) 上下文信息捕捉 流形正则化
年,卷(期) 2022,(4) 所属期刊栏目 图像分析和识别|Image Analysis and Recognition
研究方向 页码范围 1204-1215
页数 12页 分类号 TP391.4
字数 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度学习
语义分割
残差网络(ResNet)
上下文信息捕捉
流形正则化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国图象图形学报
月刊
1006-8961
11-3758/TB
大16开
北京9718信箱
82-831
1996
chi
出版文献量(篇)
5906
总下载数(次)
17
总被引数(次)
131816
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导