基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了实现在光线不佳、夜间施工、远距离密集小目标等复杂施工场景下的图像描述,提出基于注意力机制和编码-解码架构的施工场景图像描述方法.采用卷积神经网络构建编码器,提取施工图像中丰富的视觉特征;利用长短时记忆网络搭建解码器,捕捉句子内部单词之间的语义特征,学习图像特征与单词语义特征之间的映射关系;引入注意力机制,关注显著性强的特征,抑制非显著性特征,减少噪声信息的干扰.为了验证所提方法的有效性,构建一个包含10种常见施工场景的图像描述数据集.实验结果表明,所提方法取得了较高的精度,在光线不佳、夜间施工、远距离密集小目标等复杂施工场景下具有良好的图像描述性能,且具有较强的泛化性和适应性.
推荐文章
结合引导解码和视觉注意力的图像语义描述模型
图像描述
多示例学习
引导解码
视觉注意力机制
融入视觉常识和注意力的图像描述
图像描述
注意力机制
视觉常识
注意偏差
基于预读及简单注意力机制的句子压缩方法
自然语言处理
句子压缩
预读
注意力机制
基于自注意力机制的方面情感分类
方面词
情感分类
自注意力机制
语义编码
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于注意力机制和编码-解码架构的施工场景图像描述方法
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 图像描述 施工场景 注意力机制 编码 解码
年,卷(期) 2022,(2) 所属期刊栏目 计算机与控制工程|Computer and Control Engineering
研究方向 页码范围 236-244
页数 9页 分类号 TP391
字数 语种 中文
DOI 10.3785/j.issn.1008-973X.2022.02.003
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图像描述
施工场景
注意力机制
编码
解码
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
论文1v1指导