基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了探索图像场景理解所需要的视觉区域间关系的建模与推理,提出视觉关系推理模块.该模块基于图像中不同的语义和空间上下文信息,对相关视觉对象间的关系模式进行动态编码,并推断出与当前生成的关系词最相关的语义特征输出.通过引入上下文门控机制,以根据不同类型的单词动态地权衡视觉注意力模块和视觉关系推理模块的贡献.实验结果表明,对比以往基于注意力机制的图像描述方法,基于视觉关系推理与上下文门控机制的图像描述方法更好;所提模块可以动态建模和推理不同类型生成单词的最相关特征,对输入图像中物体关系的描述更加准确.
推荐文章
基于帧图像语义上下文的地形推理策略
在线地形推理
场景分析
语义上下文
人工智能中的上下文推理
上下文
上下文推理
上下文形式化
上下文推理技术在智能环境中的研究与应用
上下文推理
智能环境
规则
Jena
觉察上下文计算平台的研究
觉察上下文计算
本体模型
上下文推理
通用性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于视觉关系推理与上下文门控机制的图像描述
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 图像语义描述 视觉关系推理 多模态编码 上下文门控机制 注意力机制
年,卷(期) 2022,(3) 所属期刊栏目 计算机与控制工程|Computer and Control Engineering
研究方向 页码范围 542-549
页数 8页 分类号 TP181
字数 语种 中文
DOI 10.3785/j.issn.1008-973X.2022.03.013
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图像语义描述
视觉关系推理
多模态编码
上下文门控机制
注意力机制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
论文1v1指导