基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,基于图像视觉特征与问题文本特征融合的视觉问答(VQA)引起了研究者们的广泛关注.现有的大部分模型都是通过聚集图像区域和疑问词对的相似性,采用注意力机制和密集迭代操作进行细粒度交互和匹配,忽略了图像区域和问题词的自相关信息.本文提出了一种基于对称注意力机制的模型架构,能够有效利用图片和问题之间具有的语义关联,进而减少整体语义理解上的偏差,以提高答案预测的准确性.本文在VQA2.0数据集上进行了实验,实验结果表明基于对称注意力机制的模型与基线模型相比具有明显的优越性.
推荐文章
基于注意力机制的全景分割网络
全景分割
背景类实例重叠
三重态注意力机制
语义增强注意力机制
视觉注意力机制在货运列车车号定位中的应用
眼动跟踪
车号定位
视觉注意力
显著性
融入视觉常识和注意力的图像描述
图像描述
注意力机制
视觉常识
注意偏差
基于自注意力机制的方面情感分类
方面词
情感分类
自注意力机制
语义编码
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于对称注意力机制的视觉问答系统
来源期刊 计算机系统应用 学科
关键词 视觉问答 注意力机制 对称注意力 卷积神经网络 特征提取
年,卷(期) 2021,(5) 所属期刊栏目 系统建设|System Construction
研究方向 页码范围 114-119
页数 6页 分类号
字数 语种 中文
DOI 10.15888/j.cnki.csa.007925
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
视觉问答
注意力机制
对称注意力
卷积神经网络
特征提取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导